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精算 起 产 于 保险 业 ， 是 保险 公司 经 营 不 可 或 缺 的 核心 技术 之 一 。 保 险 
SN\ 司 只 有 运用 精算 技术 进行 保险 产品 定价 、 准 备 金 评估 、 风 险 管理 等 ， 才 
能 在 科学 基础 上 实现 保险 业务 的 稳健 经 营 ， 有 效 防 范 风险 。 

我 们 党 说 的 精算 ， 包 括 三 个 方面 ， 即 : 精算 理论 技术 、 精 算 规 则 和 精 
算 师 资格 认证 。 

精算 理论 是 对 保险 业务 经 营 中 各 种 不 确定 因素 和 风险 规律 的 认识 ， 精 
算 技 术 以 精算 理论 为 指导 ， 是 精算 工作 中 对 各 种 不 确定 因素 和 风险 进行 识 
别 、 评 佑 、 定 价 、 处 置 等 所 采用 的 方法 、 技 术 ， 和 包括 所 使 用 的 数学 模型 、 
数学 工具 等 。 随 着 保险 业经 营 实践 的 发 展 和 人 们 认识 的 深化 ， 精 算 理 论 技 
术 也 在 不 断 发 展 。 精 算 理论 技术 属于 学 术 研 究 的 范畴 ， 可 以 存在 不 同 的 观 
点 和 流派 ， 各 种 不 同 观 点 和 流派 之 间 的 讨论 、 交 流 ， 可 以 促进 精算 理论 技 
术 的 发 展 。 

精算 规则 ， 是 保险 监管 机 关 制 定 或 认可 的 关于 精算 工作 应 当 遵 循 、 遵 
守 或 采用 的 原则 、 方 法 、 标 准 、 制 度 等 规范 。 制 定 精算 规则 ， 以 精算 理论 
技术 为 基础 ， 又 要 综合 考虑 一 定时 期 的 经 济 环境 、 保 险 业 发 展 状况 和 风险 
特征 、 精 算 技 术 力 量 、 监 管 政策 的 要 求 等 多 种 因素 。 

精算 工作 需要 专业 人员 从 事 ， 精 算 师 就 是 具备 精算 的 知识 、 技 能 ， 从 
事 精算 工作 的 专业 技术 人 人员。 虽然 精算 师 的 从 业 范 围 不 限于 保险 业 ， 但 主 
要 还 是 在 保险 及 相关 行业 就 职 (如 对 保险 公司 的 精算 报告 进行 审核 的 会 计 
师 事务 所 ， 为 保险 公司 服务 的 精算 咨询 公司 等 )。 在 保险 公司 中 ,精算 师 责 
任 重 大 。 因 此 ， 必 须 经 过 资格 认证 ， 才 能 担任 精算 师 (如 同 律师 、 注 册 会 
计 师 需要 资格 认证 ) 。 在 国外 ， 精 算 师 资格 的 取得 一 般 有 两 种 方式 : 一 种 是 
通过 专业 资格 考试 取得 ， 男 一 种 是 经 过 学 历 教育 后 取得 ,但 主流 是 通过 考 
试 取 得 。 在 发 达 国 家 ， 精 算 师 有 自己 的 专业 团体 一 一 精算 师 协 会 ， 一般 由 
精算 师 协 会 组 织 资格 考试 ， 对 通过 考试 的 人 授予 精算 师资 格 。 

精算 理论 技术 、 精 算 规 则 、 精 算 师 资格 认证 三 者 相互 联系 ， 密 不 可 分 : 
精算 理论 技术 是 基础 ， 制 定 精 算 规 则 、 考 试 认 证 精算 师 ， 均 以 精算 理论 技 
术 为 基础 ， 精 算 规 则 是 精算 师 从 事 精 算 实 务 的 直接 依据 。 
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保险 法 及 相关 法 规 


我 国 自 1980 年 恢复 办 理 国 内 保险 业务 之 后 ， 曾 长 期 缺乏 精算 专业 人 
才 ， 婚 没有 制定 精算 规则 ， 也 没有 建立 自己 的 精算 师资 格 考 试 认证 制度 。 
1988 年 南开 大 学 在 北美 精算 协会 的 支持 下 开办 精算 专业 教育 ， 此 后 国内 又 
有 多 所 大 学 开办 精算 专业 教育 ， 培 养 了 一 批 精算 人 才 。 由 于 当时 中 国 役 有 
精算 师资 格 认 证 制度 ， 这 些 国内 学 习 精 算 的 人 员 主 要 是 考取 北美 和 英国 等 
国外 的 精算 师资 格 。1992 年 ， 国 内 的 保险 市 场 对 外 开放 ， 外 资 保险 公司 进 
入 国内 市 场 , 一些 具有 国外 资格 的 精算 师 到 国内 工作 。 

1995 年 颁布 并 施行 的 《中 华人 民 共 和 国保 险 法 》 中 ， 要 求 寿险 公司 必 
须 聘 用 经 金融 监管 部 门 认可 的 精算 专业 人 员 ， 建 立 精 算 报 告 制度 。《 保 险 
法 》 首先 要 求 寿险 公司 聘用 精算 师 、 建 立 精算 报告 制度 ， 是 因为 : 第 一 ， 
精算 起 源 于 寿险 业务 经 营 ， 精 算 技 术 在 寿险 业 的 应 用 较为 成 熟 ; 第 二 ， 寿 
险 业 务 期 限 长 ， 风 险 更 具 隐 蔽 性 ， 对 精算 技术 的 运用 更 为 迫切 和 重要 ， 第 
三 ， 在 精算 专业 人 员 严 重 不 足 、 精 算 规 则 空白 的 条 件 下 ， 同 时 要 求 寿险 业 
和 括 寿 险 业 聘用 精算 专业 人 员 、 建 立 精算 报告 制度 ， 难 以 实现 。 

为 此 ， 当 时 的 保险 监管 部 门 一 一 中 国人 民 银 行 保险 司 于 1997 年 10 月 
启动 了 “中 国 精 算 制度 建设 ”研究 项 目 ， 决 定 建 立 中 国 的 精算 师资 格 考试 
认证 制度 ， 并 逐步 制定 精算 规则 。 中 国 的 精算 师资 格 考 试 认证 制度 ， 主 要 
借鉴 北美 精算 协会 的 考试 体系 ,把 精算 师资 格 分 为 准 精 算 师 和 精算 师 两 个 
阶段 ， 分 别 设立 考试 课程 ， 通 过 准 精 算 师 考试 课程 的 ， 授 予 准 精算 师 资格 ， 
在 获得 准 精算 师资 格 基础 上 ， 再 通过 精算 师资 格 考 试 的 课程 ， 授 予 精算 师 
资格 。 在 课程 设置 、 考 试 内容 、 难 度 等 方面 ， 均 力求 达到 与 发 达 国 家 的 精 
算 师 考试 相当 的 水 平 。 在 制度 设计 、 拟 定 考 试 大 纲 、 教 材 编写 过 程 中 ， 得 
到 国际 精算 团体 的 大 力 支持 和 帮助 。1998 年 11 月 ， 中 国保 监 会 成 立 之 后 ， 
继续 推进 精算 制度 建设 。2000 年 ， 中 国 精 算 师 资格 考试 开 考 ， 与 此 配套 的 
教材 也 陆续 出 版 发 行 。 中 国保 监 会 1999 年 发 布 了 关于 寿险 公司 的 精算 规 
定 ， 建 立 了 寿险 公司 精算 规则 体系 的 基本 框架 。 

2002 年 10 月 《保险 法 》 进行 了 第 一 次 修改 ， 于 2003 年 1 月 1 日 起 施 
行 。 修 改 后 的 《保险 法 》 把 聘用 经 金融 监管 部 门 认可 的 精算 专业 人 员 ， 建 
立 精算 报告 制度 的 要 求 扩 大 到 非 寿 险 公 司 。 因 此 ， 经 过 论证 、 筹 备 后 ， 自 
2004 年 开始 进行 非 寿 险 精 算 师 的 资格 考试 认证 ， 称 为 中 国 精 算 师 ( 非 寿 险 
方向 ) ， 与 此 相 适 应 ， 以 前 的 精算 师 则 称 为 中 国 精 算 师 (寿险 方向 )。 同 时 
关于 非 寿 险 精 算 的 规则 也 由 中 国保 监 会 陆续 制定 发 布 。 

2007 年 ， 中 国 精算 师 协会 成 立 ， 组 织 精 算 师 资格 考试 是 协会 的 重要 职 
能 之 一 。 协 会 设立 了 考试 教育 委员 会 ， 负 责 精 算 师 资格 考试 和 后 续 教 育 事 
宜 (此 前 是 由 中 国保 险 行 业 协 会 的 精算 工作 委员 会 负责 精算 师资 格 考 试 ) 。 

中 国 精 算 师 资格 考试 施行 10 年 来 ， 通 过 考试 认证 了 一 批 中 国 精 算 师 和 


中 国 准 精算 师 ， 取 得 了 一 定 成 绩 ， 积 累 了 一 定 经 验 。 目 前 已 在 北京 、 上 海 、 
天 津 、 广 州 等 15 个 城市 设立 了 考试 中 心 ， 并 在 香港 、 加 拿 大 滑铁卢 大 学 设 
立 了 2 个 海外 考试 中 心 ， 每 年 春秋 两 季 举 办 考试 。 

随 着 国内 保险 市 场 的 发 育 、 精 算 技 术 的 发 展 及 国际 精算 界 的 变革 ， 原 
有 的 考试 体系 已 不 完全 适应 。 为 此 ， 中 国 精算 师 协 会 于 2009 年 决定 对 中 国 
精算 师资 格 考 试 认 证 体系 进行 调整 ， 并 于 2011 年 实施 。 调 整 的 基本 内 容 
是 : 精算 师资 格 考 试 仍 分 为 准 精 算 师 和 精算 师 两 个 阶段 ; 在 准 精 算 师 阶段 ， 
不 再 区 分 方向 ， 对 原 寿 险 和 非 寿 险 两 个 方向 的 考试 课程 进行 整合 ， 考 生 通 
过 8 门 必 考 的 准 精 算 师 考试 课程 ， 并 经 过 职业 道德 培训 后 ， 可 获得 中 国 准 
精算 师资 格 ; 精算 师 则 继续 分 为 寿险 和 非 寿 险 两 个 方向 ， 有 3 年 以 上 工作 
经 历 的 准 精 算 师 ， 通 过 5 门 精 算 师 考试 课程 ， 并 经 过 职业 道德 培训 后 ， 可 
获得 中 国 精 算 师 (寿险 方向 ) 或 中 国 精算 师 ( 非 寿 险 方向 ) 的 资格 ，5 门 
精算 师 考 试 课程 ， 既 有 必 考 的 ， 也 有 选 考 的 ， 具 体 科 目 ， 因 寿险 和 非 寿 险 
方向 有 所 不 同 。 

对 于 在 旧 考 试 体 系 下 已 经 通过 的 考试 科目 ， 如 何 转 换 为 新 考试 体系 的 
相应 科目 ， 也 进行 了 研究 ， 制 定 了 转换 规则 。 

为 编写 新 考试 体系 的 教材 ， 中 国 精算 师 协 会 成 立 了 教材 编审 委员 会 。 
教材 编写 力图 贯彻 国际 性 、 先 进 性 和 实用 性 三 个 原则 。 国 际 性 是 指 ， 鉴 于 
中 国 精算 师 协 会 已 正式 申请 加 入 国际 精算 师 协会 ， 因 此 精算 师资 格 考 试 必 
须 符合 国际 精算 师 协会 的 要 求 ， 达 到 国际 精算 师 协 会 的 标准 。 所 以 ， 在 课 
程 设置 、 课 程 内 容 、 必 考 科 目 等 方面 ， 均 以 国际 精算 师 协 会 的 要 求 为 标准 。 
先进 性 是 指 ， 尽 可 能 把 精算 理论 技术 的 最 新 成 果 包 括 在 这 套 教材 之 中 。 实 
用 性 是 指 ， 教 材 内 容 紧 密 联 系 国内 保险 业 的 实际 ， 考 虑 国内 精算 人 员 需 要 
掌握 的 知识 和 技能 。 

教材 的 具体 编写 实行 主编 负责 制 。 教 材 编审 委员 会 研究 、 协 调 、 决 定 
教材 编写 中 的 重大 事项 ， 确 定 各 门 课 程 的 主编 和 主 审 人 员 ， 指 定 协调 人 对 
若干 相关 课程 的 内 容 调 整 、 取 人 铭 和 进度 进行 协调 。 教 材 初 稿 完成 后 ， 不 仅 
由 主 审 进行 审阅 ,而且 组 织 保险 公司 的 相关 人 员 进 行 试 读 ， 提 出 修改 意见 。 
教材 的 主编 、 主 审 、 试 恋人 和 人员 ， 都 是 在 保险 业 、 精 算 界 具有 业务 专长 、 经 
验 较 为 丰富 、 具 有 一 定 影响 力 的 和 人员 。 可 以 说 ,这 套 教 材 的 编写 ， 是 集中 
了 行业 的 知 慧 和 力量 ,凝结 着 组 织 协 调 人 人员、 编审 人 员 、 试 读 人 员 的 心血 。 

尽管 如 此 ， 我 们 仍 不 认为 这 套 教材 已 经 尽善尽美 。 由 于 经 验 不 足 、 认 
识 水 平 有 限 ， 也 由 于 时 间 人 仓促 ， 教 材 在 某 些 方面 还 显 粗糙 ， 还 存在 许多 可 
改进 、 待 完善 之 处 。 我 们 希望 在 教材 投入 使 用 之 后 ， 听 取 专 家 、 考 生 和 社 
会 各 界 人 士 的 意见 ， 将 来 进一步 修订 。 

回顾 中 国 精算 师资 格 考 试 10 年 来 的 历程 ， 是 在 保险 监管 机 关 的 领导 

















保险 法 及 相关 法 规 


下 ， 在 保险 业 、 有 关 高 等 院 校 及 社会 各 界 的 积极 参与 下 ， 在 国际 精算 组 织 
的 支持 下， 不断 发 展 、 完 善 ， 取 得 进步 的 。 在 此 ,我 谨 代 表 中 国 精算 师 协 
会 ， 对 多 年 来 关心 、 支 持 、 参 与 、 帮 助 中 国 精 算 事 业 发 展 的 有 关 领 导 、 专 
家 和 广大 的 精算 专业 人 员 表 示 真 诚 的 敬意 和 感谢 ! 


中 国 精算 师 协会 “会 长 摇 轩 计 


2010 年 11 月 15 日 





精算 科学 的 主要 部 分 是 构造 和 分 析 数 学 模型 ， 这 些 模型 刻画 了 保险 赔 
付 损 失 ， 以 及 资金 流入 和 流出 一 个 保险 系统 的 过 程 。 精 算 风 险 也 可 以 用 随 
机 模型 的 方法 进行 表述 ， 这 些 模 型 是 对 这 些 精 算 风 险 变 量 未 来 的 概率 分 布 
及 环境 状况 的 假设 。 本 教材 的 目的 是 向 读者 益 述 精算 建 模 的 过 程 ， 即 如 何 
从 实际 数据 出 发 建立 一 个 合适 的 精算 模型 。 

长 期 以 来 ， 我 国 精算 课程 和 考试 体系 都 包含 了 精算 建 模 的 内 容 ， 但 是 
它们 都 分 属于 不 同 的 课程 体系 。 生 存 模 型 及 估计 是 寿险 精算 的 重要 基础 ， 
用 于 确定 身 故 、 失 效 和 伤 残 时 间 的 概率 模型 ， 这 部 分 内 容 被 放 在 “生命 表 
基础 ”课程 中 ; 理赔 额 和 理赔 次 数 一 般 模型 是 非 寿 险 精 算 的 重要 基础 ， 用 
来 确定 非 寿 险 公 司 的 赔付 损失 分 布 ， 这 部 分 内 容 被 放 在 “风险 理论 ”课程 
中 。 虽 然 生 存 模型 与 理赔 量 和 理赔 数 分 布 模型 刻画 的 凤 险 不 同 ， 但 从 统计 
方法 上 上， 生存 模 型 的 研究 与 理赔 量 和 理赔 数 的 一 般 模 型 并 没有 本 质 的 差异 。 
因此 ， 国 际 精 算 师 协会 (IAA) 在 国际 精算 教育 指南 和 国际 认可 精算 师资 
格 考试 的 培训 大 岗 中 ， 将 这 些 内 容 放 在 一 门 课 程 (IAA6) 中 。 为 适应 IAA 
考试 体系 的 要 求 ， 中 国 精 算 师 协会 考试 委员 会 将 中 国 精 算 师 资格 考试 课程 
“05 风险 理论 ”和 “06 生命 表 基 础 ”整合 成 新 课程 体系 中 的 “A3 精算 模 
型 ”"。 作 为 这 门 课程 的 指定 教材 ， 本 书 试 图 将 这 些 内 容 整 合 在 一 起 ， 从 精算 
建 寞 的 角度 出 发 ， 以 概率 统计 为 研究 工具 ， 对 保险 经 营 中 的 损失 风险 和 经 
营 风险 进行 定量 的 刻画 ， 建 立 精 算 模 型 并 研究 模型 的 性 质 。 

为 了 保持 与 原 考 试 课程 体系 的 连贯 性 ， 本 书 是 在 中 国 精 算 师 资格 考试 
用 书 《 风 险 理 论 》 ( 吴 凡 、 王 燕 主 编 ， 中 国 财政 经 济 出 版 社 2006 版 ) 和 
《生命 表 基 础 》【( 李 晓 林 、 和 孙 佳 美 主编 ， 中 国 财 政 经 济 出 版 社 2006 版 ) 的 
基础 上 进行 编写 和 人 修订。 根据 IAA 课程 大 网 ， 本 书 增加 了 多 状态 生存 模型 、 
理赔 额 和 理赔 次 数 的 分 布 、 布 朗 运动 与 恤 余 过 程 、 信 度 理 论 、Bootstrp 模拟 
和 MCMC 模拟 等 内 容 ; 保留 了 生存 模型 、 生 命 表 、 短 期 个 体 风 险 模型 、 长 
期 聚合 风险 模型 、 修 匀 理 论 、 随 机 模拟 等 章节 的 基本 内 容 ， 删 除了 人 口 统 
计 和 效用 理论 等 内 容 。 本 书 的 最 大 特色 是 ， 重 新 编写 了 三 章 的 内 容 来 阐述 
在 完整 和 非 完 整 样本 数据 情况 下 生存 函数 、 理 赔 额 和 理赔 次 数 分 布 模型 的 
估计 和 和 选择， 并 用 两 个 案例 来 说 明 整 个 精算 的 建 模 过 程 。 

虽然 本 书 是 精算 师 考 试 教材 ， 但 并 不 要 求 读者 对 保险 系统 已 经 具有 很 


精算 模型 


好 的 知识 背景 。 凡 是 在 本 书 中 首次 出 现 保 险 术语 的 地 方 ， 我 们 都 会 给 出 定 
义 。 本 书 同时 也 是 一 本 统计 应 用 教材 ， 既 适合 于 具有 中 等 概率 统计 知识 的 
读者 学 习 怎 样 运用 统计 学 知识 处 理 和 研究 保险 业务 的 问题 ， 也 为 已 经 掌握 
较 多 数理 统计 和 随机 过 程 知识 的 读者 提供 较 深 的 理论 内 容 ， 以 便 更 好 地 党 
握 保 险 精 算 知 识 。 

本 书 由 中 国人 民 大 学 统计 学 院 肖 争 艳 老师 担任 主编 ， 负 责 全 书 统 稿 和 
编写 第 一 、 入 、 九 、 十 、 十 二 、 十 四 章 ， 并 对 第 十 一 、 十 三 章 的 初稿 进行 
了 修订 ; 中 央 财 经 大 学 保险 系 郑 苏 晋 老师 负责 编写 第 二 至 第 四 章 ， 并 对 第 
五 至 第 七 章 的 初稿 进行 了 修订 ; 北京 大 学 数学 科学 院 的 吴 岗 老师 作为 教材 
协调 人 ， 对 全 书 的 大 岗 和 内 容 提 出 了 方向 性 的 指导 意见 ; 南开 大 学 孙 佳 美 
老师 作为 教材 主 审 ， 对 全 书 进行 了 认真 细致 的 审阅 ， 并 提出 了 许多 宝贵 的 
修改 建议 ; 李 晓 宁 、 轩 冬 梅 、 钟 颖 、 史 和 森 、 郭 程 宁 等 作为 试 读 人 ， 为 本 书 
进行 了 认真 的 评审 ， 为 保证 全 书 的 出 版 质量 提供 了 有 力 的 支持 ; 北京 大 学 
数学 科学 院 的 杨 静 平 老师 也 对 本 书 提出 了 一 些 参 考 意 见 。 在 本 书 的 编写 过 
程 中 ， 中 国人 民 大 学 统计 学 院 的 一 些 研 究 生 也 参与 了 本 书 初稿 编写 和 习题 
解答 等 工作 ， 他们 是 : 邵 亚 娣 、 李 群 、 刘 天 营 、 王 伟 伟 、 左 搬 、 鲍 金辉 、 
张 选 铭 、 徐 梦 语 、 蒋 安 华 和 程 夏 莹 等 同学 ， 同 时 还 有 许多 读者 、 专 家 也 提 
出 了 宝贵 的 意见 和 建议 ， 在 此 一 并 表示 衷心 的 感谢 。 
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51.1 构建 精算 模型 


所 谓 模 型 ， 就 是 对 现实 的 一 种 数学 简化 。 对 任何 给 定 问 题 的 研究 ， 都 
可 以 用 模型 化 的 方法 来 解决 。 精 算 中 许多 问题 的 解决 都 需要 借助 于 模型 。 
例如 ， 在 寿险 中 ， 通 过 建立 生存 模型 ， 对 人 口 的 死亡 规律 进行 分 析 来 预测 
被 保险 人 未 来 的 赔付 ; 在 非 寿险 中 ， 精 算 师 通过 估计 被 保险 人 的 索赔 次 数 
和 索赔 额 的 分 布 来 进行 费 率 厘定 、 准 备 金 计 提 、 再 保险 安排 等 一 系列 精算 
问题 。 因 此 ,北美 精算 协会 在 公开 发 表 的 《精算 学 基本 原理 》 中 指出 : 
“精算 风险 可 以 用 随机 模型 的 方法 进行 表述 ， 这 些 模 型 是 对 这 些 精算 风险 变 
量 未 来 的 概率 分 布 以 及 未 来 的 环境 状况 的 假设 ”?。 这 里 的 精算 风险 变量 一 
般 指 : 风险 是 否 发 生 、 发 生 的 时 间 和 损失 量 一 一 索赔 事件 的 发 生机 率 、 如 
果 索 赔 事件 发 生 其 发 生 的 时 间 以 及 围绕 索赔 的 所 有 成 本 。 

精算 模型 的 构建 有 两 种 方法 : 经 验 法 和 参数 模型 法 。 经 验 法 就 是 不 对 
模型 做 任何 分 布 假设 ， 直 接 使 用 经 验 数 据 建 模 。 当 统计 数据 特别 充足 而 且 
完整 时 ， 经 验 分 布 趋 近 于 真实 分 布 。 但 在 通常 情况 下 ， 我们 所 获得 的 样本 
数据 是 有 限 的 ， 尤 其 是 关于 高 额 赔付 的 数据 更 为 有 限 。 有 时 得 到 的 数据 还 
是 不 完整 的 ， 有 可 能 被 截断 或 被 删 失 。 这 些 都 会 导致 经 验 法 存在 偏差 。 下 
面 两 个 例子 将 阐明 这 一 点 。 

【 例 1-1】 某 团体 人 寿 保险 合同 由 不 同年 龄 和 不 同 受益 水 平 的 500 个 
雇员 组 成 。 在 过 去 的 5 年 中 ,已 有 8 名 雇员 身 故 并 共计 得 到 45 万 元 。 由 于 
该 计划 的 身 故 赔付 与 雇员 的 工资 水 平 挂钩 ， 所 以 需要 将 赔付 进行 通货 膨胀 
调整 。 假 设 下 一 年 通货 膨胀 率 是 10% ， 试 根据 以 上 信息 对 该 合同 下 一 年 的 
预期 身 故 赔付 进行 经 验 估 计 。 





”这 名 话 来 自 Society of Actuaries Committee on Actuarial Principles ，“ principles of actuarial sciencc”， 
Transactions of the Society of Actuary，1992 ， 第 571 页 的 原理 3. 1。 


解 : 5 年 内 年 平均 赔付 额 为 9 万 元 ， 考 虑 到 通货 膨胀 因素 ， 预计 下 一 年 
预期 身 故 赔付 为 9.9 万 元 。 当 然 这 个 估计 的 缺陷 在 于 ， 过 去 5 年 的 经 验 不 
一 定 完全 能 够 反映 这 个 合同 在 未 来 一 年 的 情况 ， 因 为 在 如 此 短 (5 ~6 年 ) 
的 时 间 内 身 故 赔付 的 表现 可 能 会 有 很 大 波动 。 慑 

看 来 ， 更 合理 的 方法 是 建立 一 个 模型 。 依 例 1 -1， 应 建立 一 个 生命 表 ， 
而 要 构造 这 样 的 表 需 要 积累 很 多 个 体 的 经 验 ，500 个 人 的 经 验 是 不 够 的 。 
有 了 这 张 生命 表 ， 不 仅 可 以 估计 下 一 年 的 预期 赔付 ， 还 可 以 度量 我 们 所 作 
的 估计 本 身 的 风险 。 

【 例 1-2】 考虑 一 个 公司 团体 牙医 保险 计划 。 目 前 保单 规定 ， 每 次 事 
故 的 免 赔 额 为 30 元 ， 即 只 对 一 次 医疗 费用 超过 50 元 的 保单 赔付 超出 的 部 
分 。 为 了 减少 保险 公司 的 平均 赔付 成 本 ， 有 3 种 修改 方案 。 第 一 种 方案 认 
为 应 该 取消 免 赔 额 ， 这 样 员 工 就 会 经 常 去 看 牙 ， 从 而 减少 高 昂 的 医疗 费用 ; 
第 二 种 方案 认为 应 该 提高 免 赔 额 到 100 元 ， 以 降低 赔付 成 本 ; 第 三 种 方案 
认为 应 该 限制 对 高 额 损失 的 赔付 ， 建 议 保持 免 赔 额 50 元 不 变 , 但 每 次 最 高 
理赔 额 不 超过 2 000 元 。 作 为 精算 师 ， 你 认为 哪 种 方案 比较 合理 ? 为 了 研究 
方便 ， 假 设 你 已 经 随机 抽取 了 10 个 赔付 数据 : 141、16、46、40、351、 
259、317、1511、107、567。 

解 : 在 免 赔 额 为 50 元 的 条 件 下 ， 每 次 赔付 的 平均 值 为 335.5 元 。 如 果 
免 赔 额 提高 到 100 元 ， 上 上述 保单 的 赔付 额 数据 将 变 为 : 141 -50 =91，351 - 
50 =301，…，567 -50 =517 元 ,其 中 赔付 额 低 于 50 元 的 保单 将 为 0。 于 
是 平均 理赔 额 为 (91 +301 +…+517)/7 =2 903/7 =414.7 元。 保险 公司 的 
成 本 将 减少 (3 355 -2 903)/3 355 =13.47%。 

当 免 赔 额 为 0， 上 述 理赔 额 分 别 为 : 141 +50 =191, 16 +50 =66，…， 
567 +50 =617 元 。 平 均 理 赔 额 为 3 855/10 = 385.5 元 。 保 险 公 司 的 成 本 将 
提高 (3 855 -3 355)/3 355 =14. 90% 。 

实际 上 ， 当 取消 免 赔 额 时 ， 经 验 法 得 到 的 结果 是 没有 意义 的 ， 因 为 我 
们 使 用 的 数据 并 不 是 真正 来 自 原 始 样本 。 如 果 免 赔 额 为 0， 则 任何 有 医疗 花 
费 的 保单 都 可 以 获得 赔付 ， 也 都 应 该 有 可 能 被 随机 抽取 到 。 但 是 由 于 最 初 
的 保单 规定 免 赔 额 为 50 元 ， 因 此 医疗 费用 低 于 50 元 的 保单 损失 不 可 能 被 
保险 公司 所 记录 ， 更 不 可 能 被 随机 抽取 。 这 样 会 损失 了 大 量 的 原始 数据 ， 
造成 估计 结果 的 偏差 。 

对 于 第 三 种 方案 ， 经 验 法 无 法 衡量 这 个 修改 对 平均 赔付 额 的 影响 ， 因 
为 样本 数据 中 没有 理赔 额 超 过 2 000 元 的 数据 。 

经 验 法 的 上 述 缺 陷 可 以 通过 建立 参数 模型 来 解决 。 在 例 1 -2 中 ,假设 
每 张 保单 的 原始 医疗 费用 服从 对 数 正 态 分 布 LN(4, o) ， 利 用 极 大 似 然 法 
得 到 参数 估计 值 为 亡 =5.262, 5 =1.112。 经 计算 得 到 免 赔 额 为 50 元 时 ， 


每 张 保单 的 平均 赔付 额 为 308. 88 元 。 当 免 赔 额 提高 到 100 元 时 ,平均 赔付 
额 为 268. 93 元 ， 平均 赔付 额 将 减少 14.88%。 当 取消 免 赔 额 时 ， 则 每 张 保 
单 的 平均 赔付 额 等 于 对 数 正 态 分 布 的 期 望 值 356. 49 元 。 由 于 医疗 费用 大 于 
50 元 的 概率 为 0.8876, 若 取 消 免 赔 人 额 ， 理 赔 次 数 将 会 增加 0.11569/ 
0. 88776 =12. 66% 。 当 每 张 保单 的 最 高 赔付 额 不 超过 2 000 元 时 ， 每 张 保单 
的 平均 赔付 额 为 287. 22 元 ， 平 均 赔 付 额 将 减少 7.1% 。 醒 

相 比 较 而 言 ， 参 数 模型 法 对 分 析 问 题 更 加 有 有用。 首先 ， 理 论 分 布 中 有 
丰富 的 应 用 性 质 (如 中 心 极限 定理 、 独 立 同 分 布 泊 松 随机 变量 的 可 加 性 )， 
这 些 性 质 有 助 于 对 实际 问题 进行 分 析 ; 其 次 ,参数 模型 法 更 加 简单 ， 完 全 
可 以 由 少数 几 个 参数 概括 ， 如 泊 松 分 布 、 指 数 分 布 只 有 一 个 参数 ， 正 态 分 
布 、 对 数 正 态 分 布 、 伽 玛 分 布 、 帕 累 托 分 布 和 负 二 项 式 分 布 也 仅 有 两 个 参 
数 ; 最 后 ， 模 型 法 不 仅 可 以 给 出 各 种 相关 量 的 点 估计 值 ， 还 可 以 估计 置信 
区 间 ， 进 行 误差 分 析 。 

图 1 -1 是 建立 参数 模型 流程 的 示意 图 了 ?了 ， 这 个 流程 由 以 下 六 个 阶段 
组 成 : 

第 一 阶段 ， 根 据 分 析 人 员 对 现 有 数据 的 性 质 和 形式 的 先 验 认 知 和 经 验 ， 
初步 选择 一 个 或 多 个 模型 。 例 如 ， 在 研究 死亡 率 时 ， 所 选 的 模型 也 许 会 包 
含 以 下 这 些 协 变量 : 年 龄 、 人 性别、 保单 生效 期 限 、 保 单 类 型 、 健 康 方面 的 
信息 和 生活 方式 等 。 在 研究 保险 的 损失 量 大 小 时 ， 会 对 统计 分 布 类 型 有 一 
些 自然 的 选择 (例如: 对 数 正 态 、 合 玛 、 威 布尔 )。 

第 二 阶段 ， 基 于 观测 数据 进行 模型 的 校准 。 在 研究 死亡 率 的 情形 ， 数 
据 可 能 是 某 寿 险 保单 群体 的 信息 ; 在 研究 财产 保险 的 索赔 时 ， 数 据 可 能 是 
某 财 产 保 险 群 体 的 实际 赔付 数据 。 

第 三 阶段 ， 确 定 所 拟 合 模 型 的 有 效 性 是 否 充 分 考虑 了 数据 中 的 所 有 信 
息 。 这 里 可 以 采用 各 种 诊断 检验 。 例 如 一 些 著名 的 统计 检验 : 卡 方 拟 合 优 
度 检 验 、Kolmogorov - Smirnov 检验 ， 或 者 按照 事物 的 本 质 进 行 的 定性 检验 。 
检验 方法 的 选择 直接 依赖 于 建 模 的 目的 。 在 保险 有 关 的 研究 中 ， 经 常 要 求 
最 终 的 模型 能 够 从 整体 上 复制 出 实际 经 验 数 据 所 表现 的 损失 ， 保 险 实 务 中 
也 常 称 之 为 “模型 的 无 偏 性 ”。 

第 四 阶段 ， 要 有 适当 的 机 会 考虑 其 他 可 选 模型 。 特 别 是 ， 如 果 在 第 三 
阶段 揭示 出 前 面 的 模型 不 适用 ， 这 个 步骤 将 特别 有 价值 。 在 这 个 阶段 也 许 
会 考虑 不 止 一 个 的 有 效 模 型 。 

第 五 阶段 ， 将 所 有 第 一 至 第 四 阶段 考虑 的 有 效 模 型 按照 一 定 的 准则 进 
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行 比 较 选 择 。 这 时 可 以 利用 前 面 获得 的 一 些 检验 结果 ， 也 可 以 考虑 其 他 的 
准则 。 一 旦 某 个 模型 胜出 ， 则 淘汰 的 那些 模型 可 用 于 敏感 性 分 析 。 

第 六 阶段 ， 最 终 要 保证 被 选 出 的 模型 适用 于 未 来 的 应 用 。 也 许 要 对 参 
数 进行 适当 的 调整 ， 以 反映 从 观测 数据 时 期 到 未 来 模型 使 用 时 期 之 间 的 通 
货 膨胀 变化 。 

当 新 的 数据 产生 或 者 环境 有 所 变化 时 ， 需 要 重复 进行 以 上 六 个 步骤 以 
改进 模型 。 





图 1-1 建 模 的 流程 


在 模型 选择 中 ， 要 注意 对 模型 的 拟 合 程度 和 简单 程度 进行 平衡 ， 对 模 
型 的 优 劣 给 予 客观 的 评价 。 简 洁 性 是 指 模 型 中 待 估计 的 未 知 参 数 个 数 尽 可 
能 少 ， 准 确 性 是 指 模型 对 实际 数据 的 拟 合 的 误差 尽 可 能 小 。 另 一 个 需要 注 
意 的 问题 是 ， 对 损失 分 布 估计 应 考虑 获得 该 分 布 的 具体 精算 要 求 。 在 不 同 
的 精算 目的 下 ， 对 损失 分 布 估 计 的 精度 要 求 不 一 样 ， 代 价 也 不 一 样 。 例 
如 ， 如 果 是 为 了 制定 费 率 ， 则 对 损失 分 布 的 中 间 部 分 的 分 布 情况 要 求 较 
高 ; 如 果 是 为 了 考虑 再 保险 自 留 额 的 问题 ， 则 对 损失 分 布 的 尾部 要 作 更 
细致 的 估计 。 


51.2 本 书 的 缩 构 


本 书 将 向 读者 展示 整个 精算 建 模 过 程 。 我 们 假定 读者 已 经 掌握 了 高 等 
数学 和 概率 统计 的 基础 知识 。 我 们 首先 要 学 习 寿 险 和 非 寿 险 中 的 基本 风险 
模型 并 介绍 如 何 使 用 这 些 模型 ， 然 后 再 讨论 模型 参数 的 估计 以 及 如 何 选 择 
模型 。 本 书 结构 如 下 : 

1. 生存 模型 和 生命 表 。 死 亡 风 险 是 寿险 精算 中 的 最 主要 的 风险 。 在 第 


二 章 中 将 介绍 寿险 精算 中 生存 模型 的 基本 概念 及 形式 ， 对 生存 函数 进行 研 
究 ， 进 而 对 死亡 率 和 条 件 死亡 率 的 概念 及 公式 进行 前述。 生命 表 是 表达 生 
存 模 型 的 一 种 最 常见 的 形式 ， 在 第 三 章 中 将 给 出 生命 表 的 传统 形式 和 标准 
精算 符号 ， 以 之 为 基础 ， 推 导 死 亡 年 龄 随机 变量 的 概率 密度 函数 ， 给 出 风 
险 暴 露 数 的 概念 和 计算 公式 ， 并 对 非 整 数 年 龄 的 死亡 概率 进行 阐述 。 

2. 单 张 保单 的 理赔 额 和 理赔 次 数 分 布 。 保 单 理赔 发 生 的 时 间 、 发 生 次 
数 和 每 次 理赔 的 金额 是 非 寿 险 中 最 主要 的 风险 来 源 。 在 第 四 章 中 我 们 将 介 
绍 财 产 险 中 单 张 保 单 的 理赔 额 和 理赔 次 数 分 布 。 一 般 情况 下 ， 保 险 合同 不 
可 能 对 标的 损失 提供 全 额 的 赔偿 。 因 此 我 们 首先 说 明理 赔 额 和 损失 额 的 区 
别 与 联系 ， 其 次 介绍 常见 的 保险 责任 : 免 赔 额 、 保 单 限额 和 比例 分 保 的 基 
本 概念 ， 并 研究 带 有 这 些 保险 责任 后 理赔 额 和 理赔 次 数 的 分 布 。 最 后 介绍 
几 种 常见 的 理赔 次 数 分 布 的 性 质 ， 并 讨论 免 赔 人 额 对 理赔 次 数 分 布 的 影响 。 

3. 短期 多 张 保单 的 总 理赔 额 的 分 布 。 在 对 一 些 保单 组 合 、 茶 个 业务 线 
或 者 某 个 公司 进行 损失 建 模 时 ， 我们 将 关心 赔付 的 整体 情况 。 第 五 章 研 究 
个 体 风 险 模 型 ， 即 保单 组 合 中 保单 数 已 知 ， 假 设 每 张 保 单 至 多 只 发 生 一 次 
理赔 ， 且 相互 独立 。 第 六 章 研 究 聚 合 风 险 模 型 ， 是 既 考 虑 赔付 次 数 ， 又 考 
谍 每 次 赔付 的 金额 的 总 理赔 额 模型 。 

4. 破产 概率 。 保 险 公 司 的 经 营 过 程 是 动态 的 。 第 七 章 将 不 仅 考 虑 保险 
人 长 期 的 赔付 情况 ， 还 将 引入 保费 收入 、 投 资 收 入 和 费用 支出 以 及 其 他 可 
能 影响 现金 流 的 因素 来 研究 保险 人 硬 余 的 变化 规律 。 我 们 将 分 别 建立 连续 
时 间 和 离散 时 间 和 至 余 过 程 的 概念 和 破产 概 府 的 计算 公式 及 性 质 。 

5. 经 验 模型 。 有 时 人 们 需要 利用 数据 的 经 验 分 布 ， 这 也 许 是 因为 数据 
的 规模 足够 大 或 者 是 因为 需要 很 好 的 表现 数据 本 身 的 特点 。 第 八 章 将 讨论 
这 些 内 容 ， 包 括 对 完整 个 体 数 据 直 接 计算 的 简单 情形 、 对 截断 或 删 失 数据 
的 调整 、 对 大 数据 集 的 适当 修正 ， 特 别 是 对 生存 模型 的 研究 。 

6. 参数 模型 的 估计 和 选择 。 构 建 精算 模型 的 关键 在 于 选择 一 个 合适 的 
分 布 模型 并 估计 参数 。 第 九 章 对 不 同 数据 类 型 下 参数 估计 方法 进行 了 详细 
阐述 ， 讨 论 参 数 的 区 间 佑 计 和 极 大 似 然 估 计 的 方差 ， 介 绍 含 伴随 变量 的 参 
数 模 型 。 第 十 章 将 考虑 模型 选择 问题 ， 包 括 被 选 模型 与 实际 数据 函数 图 形 
上 的 直观 比较 和 筛选 直观 的 选择 、 用 统计 学 方法 对 模型 分 布 函 数 进 行 拟 合 
优 度 检验 、 评 分 法 选择 最 优 模型 。 

7. 估计 的 调整 。 在 此 ， 还 需要 对 结果 作 进 一 步 的 调整 。 本 书 中 介绍 了 
两 种 调整 方法 ， 首 先是 修 匀 调整 。 有 时 我 们 得 到 的 估计 值 不 一 定 满 足 先 验 
的 观点 。 例 如 死亡 率 ， 我 们 认为 它 应 该 是 关于 年 龄 的 连续 变化 、 递 增 的 光 
请 曲线 。 而 在 大 多 数 情 形 下 ， 这 个 序列 的 每 个 元 素 是 彼此 独立 得 到 的 ， 它 
们 不 一 定 满足 光滑 性 和 递增 性 ， 所 以 需要 采用 修 匀 方法 进行 必要 的 调整 。 


精算 模型 


第 十 一 章 讨 论 了 表格 数据 修 匀 各 参数 修 匀 的 几 种 方法 。 其 次 是 信和 度 调 整 。 
有 时 我 们 得 到 的 见 个 估计 都 是 基于 很 小 的 观测 量 得 到 的 ， 数 据 的 可 信和 度 不 
高 ， 这 时 可 以 考虑 添加 一 些 相关 的 先 验 信息 来 提高 估计 的 精度 。 第 十 二 章 
的 信和 度 理论 考虑 了 如 何 结 合 先 验 信息 进行 适当 调整 的 机 制 和 方法 。 

8. 随机 模拟 。 在 很 难得 到 解析 结果 时 ， 随 机 模拟 〈 利 用 随机 数 ) 方法 
也 许可 以 提供 一 些 答案 。 第 十 三 章 讨论 各 种 随机 变量 随机 数 的 产生 方法 ， 
还 简单 介绍 了 目前 流行 的 bootstrap 法 和 MCMC 模拟 法 的 技术 。 

9. 案例 分 析 。 在 第 十 四 章 中 ， 我 们 给 出 了 两 个 案例 来 说 明 精 算 建 模 的 
流程 。 


第 二 章 ”生存 分 析 的 基本 函数 及 生存 模型 





口 了 解 对 一 元 和 多 元 生存 模型 进行 分 析 的 基本 函数 : 生存 函数 、 概 率 
密度 函数 、 危 险 率 函数 、 剩 余 寿 命 均 值 以 及 剩余 寿命 中 位 数 

口 了 解 五 类 参数 生存 模型 : 均匀 分 布 、 指 数 分 布 、Gompertz 分 布 、 
Makeham 分 布 以 及 韦伯 分 布 

口 训 悉 生存 分 析 基 本 了 有 承 数 的 概念 及 其 相互 关系 ， 熟 悉 这 些 基本 函数 对 
应 的 精算 符号 
号 进行 演算 


2 生存 分 机 的 基本 函 区 


简单 地 说 ， 生 存 分 析 就 是 对 特定 事件 发 生 的 时 间 进 行 分 析 和 推断 。 由 
于 研究 领域 不 同 ， 这 一 特定 事件 可 以 是 生物 体 的 死亡 、 疾 病 的 出 现 、 设 备 
的 失效 或 者 债券 的 违约 。 这 些 事件 发 生 的 时 间 受 随机 因素 的 影响 ， 是 一 个 
随机 变量 ,通常 我 们 称 其 为 生存 时 间 随 机 变量 ,用 7 了 表示 ， 其 含义 是 个 体 
从 初始 时 刻 开 始 直 至 死亡、 发 生 疾 病 、 失 效 或 者 违约 的 时 间 ， 以 下 为 了 简 
便 起 见 ， 我 们 称 了 是 个 体 从 初始 时 刻 到 死亡 的 时 间 。 

了 的 分 布 特征 可 以 通过 以 下 四 个 函数 来 描述 : (1) 反映 个 体 存活 时 间 超 
过 时 间 上 的 概率 的 生存 函数 ; (2) 反映 给 定年 龄 的 个 体 在 下 一 瞬间 死亡 概率 
的 危险 率 函 数 ; (3) 反映 无 条 件 瞬间 死亡 概率 的 概率 密度 苯 数 ; (4) 反映 平 
均 死 亡 时 间 的 剩余 寿命 均值 。 

这 四 个 函数 与 另 一 个 常用 函数 一 累积 危险 率 画 数 一 起 ， 刻 画 了 随机 
变量 了 不 同 的 特征 。 


人 


ee 


生存 时 间 随 机 变量 7 了 表示 个 体 从 初始 时 刻 开始 的 “未 来 寿命 ”"， 通常 


我 们 总 是 从 某 一 时 刻 开 始 记 录 某 种 生物 体 、 某 种 设备 的 “未 来 寿命 ”， 我 
们 将 这 一 起 始 时 刻 记 为 上 =0， 在 上 =0 发 生 的 事件 称 为 初始 事件 。 

描述 生存 时 间 统 计 特 征 的 基本 函数 是 生存 函数 ， 它 反映 被 观察 个 体 在 
任意 时 刻 二 0) 仍 然 生存 的 概率 ， 我 们 将 其 定义 为 : 

S(1) = P(T > 1) (2.1.1) 
显然 有 : DT>0; 加 5(0) = 1; @5(1) 是 :的 非 增 函数 ， 且 limS(i) = 0。 

生存 渔 数 有 了 时 与 初始 时 刻 个 体 的 年 龄 无 关 ， 例 如 对 已 确诊 患 有 某 种 重 
大 疾病 的 病人 而 言 ， 一 旦 确诊 ， 其 生存 概率 仅 依 赖 于 时 间 1 ， 而 与 病人 确 
座 时 的 年 龄 元 关 。 但 在 人 寿 保 险 与 养老 金 计 划 的 生存 模型 中 ,必须 考虑 所 研 
究 对 象 的 确切 年 龄 〈 自 然 年 龄 ) ， 这 是 因为 不 同年 龄 群体 的 生存 概率 P(T > 
1) 有 很 大 的 不 同 。 

考虑 一 个 x 岁 (通常 x 取 整 数 ， 称 其 为 选择 年 龄 ) 的 投保 群体 的 生存 
孙 数 ,我们 把 保单 签发 的 时 刻 作 为 初始 时 刻 1: = 0 ， 讨 论 生存 旺 数 S(i)。 

显然 ,x = 25 与 x = 45 所 对 应 的 函数 S(1) 不 一 样 。 为 了 刻画 已 (了 > 1) 
对 x 的 依赖 关系 ,我 们 通常 将 其 记 为 

P(T >1) = S(t; x) (2. 1.2) 
式 (2.1.2) 中 的 选择 年 龄 x 称 为 伴随 变量 ,未 来 的 寿命 ;1 称 为 主要 变量 。 
这 时 ， 生 存 函 数 为 式 (2. 1.2)。 

年 龄 不 是 唯一 对 生存 薄 数 S(t1) 有 影响 的 伴随 变量 ， 性 别 、 吸 烟 与 否 等 
因素 对 未 来 寿命 都 有 影响 。 如 果 考 虑 这 些 因 素 ， 那 么 对 年 龄 为 x 岁 的 男性 
(m) 吸烟 者 (s) 来 说 ， 其 生存 函数 则 为 S(1; x, m, s) ， 其 中 x, m,s 均 为 
伴随 变量 。 更 一 般 的 生存 困 数 为 S(1; x ,x,,，…, Xx。)。 其 中 ,x ,Xx,，…，X。 
是 对 生存 有 影响 的 严 个 伴随 变量 ， 我 们 称 这 样 的 生存 函数 为 选择 生存 函数 。 

特殊 情况 下 ， 如 果 在 初始 时 刻 x = 0 ， 妈 个体 为 新 生 婴 儿 ， 那 么 根据 式 
(2.1.2)， 生 存 函 数 为 S(40) ,也 可 简写 为 5S(:) 。 我 们 注意 到 ， 在 时 刻 
上 ， 被 观察 者 的 自然 年 龄 也 刚好 是 上 岁 ， 在 不 致 引起 混淆 的 情况 下 ， 可 用 x 
代 兰 ; ， 此 时 新 生 儿 的 生存 函数 就 是 S(x) ， 对 应 的 随机 变量 对 表示 新 生 婴 
儿 的 死亡 年 龄 (或 称 为 未 来 生命 随机 变量 ), S(x) = P(X > x)。 

当 了 为 连续 型 随机 变量 时 ， 生 存 函数 与 累积 分 布 画 数 互 补 ， 即 SCi) = 
1-F(t) ， 这 里 Fi) = P(T<1) ,同时 ,生存 函数 也 是 概率 密度 函数 f(z) 


的 积分 , 即 S(t) = P(T > 中 = 人 f(y)dy ,因此 ， 
fi) = -2 (2.1.3) 
5(1) 的 图 形 叫做 生存 曲线 ， 陡 峭 的 生存 曲线 表示 较 低 的 生存 概率 或 较 
短 的 生存 时 间 ， 平 缓 的 生存 曲线 表示 较 高 的 生存 率 或 较 长 的 生存 时 间 。 
【 例 2 -1】 生存 时 间 随 机 变量 服从 指数 分 布 ， 其 生存 函数 为 S(t) = 


e- 训 ，t 宇 0,，9>0， 图 2-1 为 指数 生存 曲线 。 
当 了 7 为 离散 型 随机 变量 时 ， 假 设 其 概率 分 布 函 数 p() = P(T = 4:)， 
7 =1,2,，…，, 其 中 中 < 了 <…，, 那么 7 的 生存 洱 数 为 : 
SCi) = P(T > 1) 


到 > p(t) a (2. 1.4) 
【 例 2 -2】 假设 生存 时 间 了 服从 离散 均匀 分 布 ， 概 率 分 布 函数 为 : 
p(s) = P(T = 让 = 本， 


7=1,2,3 
其 生存 函数 为 : 


S(1) = P(T > = > p(s,) = 


其 生存 曲线 如 图 2 -2 所 示 。 





时 间 


0 051 132 253 354 4.55 


图 2-1 指数 生存 曲线 图 2 -2 离散 型 随机 寿命 的 生存 曲线 
但 
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危险 率 廿 数 是 生存 分 析 中 的 男 一 个 基本 函数 ， 它 描述 被 观察 个 体 在 某 
时 刻 存 活 的 条 件 下 ， 在 以 后 的 单位 时 间 内 死亡 的 (条件 ) 概率。 危险 率 函 
数 也 称 为 条 件 退 时 死亡 率 、 死 亡 密度 。 在 人 口 学 中 ， 它 也 被 称 为 死亡 力 ， 
在 可 靠 性 研究 中 ， 也 称 为 条 件 失效 率 。 


危险 率 函 数 的 定义 为 : 
_ f(t) 
h(i) = Er (2. 1.5) 


精算 模型 
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显然 ,h(it) 是 在 生存 到 时 刻 i 的 条 件 下 的 死亡 密度 。 
我 们 注意 到 ， 式 (2.1.3) 和 式 (2.1.5) 都 是 对 个 体 在 ;时刻 死亡 密 
度 的 瞬时 度量 , 但 fl(i) 只 需 个 体 在 初始 时 刻 生 存 即 可 ， 而 h(t) 却 需 个 体 在 
时 刻 t 生存， 这 也 是 称 f(t) 是 时 刻 上 死亡 的 无 条 件 密 度 ， 而 h(t) 是 条 件 密 
度 的 原因 。 
将 式 (2.1.3) 代入 式 (2.1.5)， 有 
_dS(1)/S(1) anS(Cb 


h(ti) = di pp (2. 1.6) 
式 (2. 1.6) 两 边 从 0 到 1 积分 得 : 

[hydy = -In SC) (和 二 而 
所 以 ， 

S(t) = ehly) dy (2. 1.8) 


在 实际 应 用 中 ， 还 经 常用 到 累积 危险 率 蚂 数 ， 记 为 H(t) ， 其 定 

义 为 : 
H(t) = [cy) dy = ln S(L) (2. 1.9) 
则 
S(t1) = e 0 (2. 1.10) 

图 2 -3 给 出 了 常见 的 危险 率 孙 数 曲线 。 

比较 常见 的 危险 率 曲 线 是 “浴盆 ” 
状 危 险 率 曲线 ， 适 合 那 些 从 出 生 就 进 
入 观察 的 人 群 。 这 种 情况 下 ， 死 亡 率 
起 初 不 断 下 降 ， 主 要 原因 在 于 婴儿 容 
易 患 病 ， 生 命 比 较 脆 弱 ， 之 后 逐渐 稳 
定 ， 最 后 随 着 人 口 的 自然 老化 死亡 率 
又 逐渐 上 升 。 同 样 ， 对 于 某 些 设备 ， 
可 能 因 部 件 损坏 而 在 较 时 时候 出 现 失 是 请 
效 ， 其 后 一 段 时 间 危 险 率 保 持 不 变 ， 
到 了 设备 的 寿命 后 期 ， 和 危险 率 又 开始 
增加 。 如 果 和 危险 率先 增加 ， 然 后 开始 下 降 ， 则 称 为 “驼峰 ” 式 的 危险 率 曲 
线 ， 它 常用 于 手术 成 功 后 的 生存 建 模 。 建 模 初 期 ， 因 本 后 感染 、 出 血 或 其 
他 并 发 症 等 原因 ， 和 危险 率 增 加 ; 之 后 随 着 患者 的 康复 ， 危 险 率 和 逐步 下 降 。 

与 生存 函数 相 比 ， 和 危险 率 函 数 通 常 可 以 反映 死亡 (失效) 机 制 更 为 详细 
的 信息 。 因 此 ， 在 概括 性 地 描述 生存 数据 时 ， 和 危险 率 函数 通常 占据 主导 地 位 。 

到 目前 为 止 ， 我 们 已 经 了 解 了 三 个 进行 生存 分 析 的 函数 : 生存 函数 、 
概率 密度 函数 以 及 危险 率 函数 。 
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图 2 -3 常见 的 危险 率 曲 线 
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2.1.3 剩余 寿命 均值 和 剩余 寿命 中 位 数 

我 们 要 学 习 的 第 四 个 生存 分 析 函 数 是 剩余 寿命 均值 。 由 于 生存 时 间 7 
通常 与 初始 时 刻 个 体 的 寿命 有关， 因此 7 也 称 为 镜 余 寿命 。 

在 (0, + m ) 上 f(1) 可 积 的 条 件 下 ， 如 果 了 连续 ， 那 么 定义 剩余 寿命 均 
值 为 了 的 期 望 值 EC7) ， 即 


E(T) = fa (2.1.11) 
对 (2. 1.11) 式 进行 分 部 积分 得 : 

E(T) = 向 SCi)di (2. 1. 12) 
了 的 方差 为 : 

Var(T) = [ t+- f(t) dt- (f fd) (2.1. 13) 


如 果 P(T >y) = P(T<y) = 1/2 ， 则 称 y 为 随机 变量 了 的 中 位 数 ， 也 称 为 
个 体 的 剩余 寿命 中 位 数 或 剩余 寿命 中 位 数 。 
显然 ， 若 y 是 剩余 寿命 中 位 数 ， 则 有 


SCY) = F(y) = 并 (2. 1. 14) 


有 时 ， 尤 其 是 当 分 布 的 偏 度 较 大 时 ， 中 位 数 指标 优 于 均值 指标 。 
通过 三 个 小 节 的 内 容 , 我 们 学 习 了 反映 * 岁 个 体 生存 时 间 变 量 7T 的 分 
布 特征 的 四 个 函数 。 特 殊 地 ， 在 生命 表 中 ， 新 生 儿 的 生存 函数 为 S(x) ,其 
余 三 个 生存 分 析 晃 数 及 其 之 间 的 关系 依然 存在 ,只 是 使 用 的 符号 有 所 不 同 ， 
如 危险 率 函 数 也 称 为 死亡 力 ， 用 w. 表示 ， 而 不 是 用 h(x) ， 即 
_dS(x)/dx _ dln S(x) 





pr = I = 训 (2.1.15) 
习惯 上 用 6 表示 随机 变量 碟 的 一 阶 矩 ， 即 
Ey = -f(x)ds (2.1. 16) 


因为 @。 是 互 的 无 条 件 期 望 ， 因 此 也 被 称 为 新 生 婴 儿 鲁 余 寿 命 的 完全 期 望 ， 
即 新 生 儿 的 平均 寿命 。 

对 于 选择 生存 函数 S(t;x) , i 为 随机 变量 的 值 , x 为 选择 年 龄 ， 那 么 了 
的 期 望 值 E(7;x) 给 出 了 * 岁 人 群 的 剩余 寿命 均值 ， 用 sl. 表示 ， 它 的 危险 
率 函 数 用 ji 表示 ， 且 有 


_ _dS(i;x)/dit _ _ dln S(i;x) 
HizJt 一 S(t;x) SS dt (2.1.17) 


32. 2 参数 生存 模型 举例 








生存 模型 ， 就 是 关于 生存 分 析 基 本 函数 的 数学 模型 。 生 存 模 型 有 两 种 


精算 模型 
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基本 形式 ， 解 析 形 式 和 表格 形式 。 前 者 直接 给 出 生存 分 析 基 本 函数 的 解析 
式 ， 即 参数 生存 模型 ; 后 者 即 生命 表 ， 它 以 表格 的 形式 给 出 相关 的 生存 分 
析 基 本 函数 在 整数 点 的 值 。 

对 于 被 观察 的 个 体 ， 通 常 有 许多 原因 导致 其 在 特定 的 时 间 内 死亡 或 失 
效 ， 要 想 分 解 这 些 原因 并 从 数学 上 准确 地 描述 十 分 困难 。 通 常 ， 可 以 选择 
合适 的 理论 分 布 来 通 近 生存 数据 。 本 节 介 绍 几 个 可 作为 生存 模型 的 非 负 连 
续 型 概率 分 布 ， 并 概括 其 特征 ， 说 明 其 应 用 。 


2.2.1 均匀 分 布 
均匀 分 布 是 仅 有 两 个 参数 的 分 布 ， 其 概率 密度 函数 为 : 
1/(b -a), tela,bl] 
| t¢ [a,b] 
如 果 参 数 a = 0 ,b 就 是 区 间 长 度 ， 同 时 也 是 i 取 到 的 最 大 值 。 我们 常 
用 极限 年 龄 w 表示 这 个 参数 ， 此 时 其 密度 函数 为 : 
l/w, ie [0,w] 


f(s) = 


= 2.2.1 

/li) fe 了 ( ) 
显然 ， 式 (2.2.1) 表示 的 均匀 分 布 有 以 下 性 质 : 
F(t) = | f(y)dy = 二 (2 
SC =1- F(t) = | Amy = 全 Cw 
£ (人 
PC = (2. 2.4) 
“ w 

E(T) = | t+ f(t)dt = 名 (2. 2.5) 
Var(T) = E(T) - [EC(T)]’ = (2. 2.6) 


12 
均匀 分 布 是 Abraham de Moivre 于 1724 年 提出 的 表示 生存 模型 的 第 一 个 
连续 型 概率 分 布 。 需 要 注意 的 是 ， 在 时 间 区 间 较 长 的 情况 下 ， 将 剩余 寿命 
随机 变量 卫视 为 均匀 分 布 并 不 合适 。 


人 


-ini ear ey 


这 是 一 个 在 理论 上 经 常 使 用 的 单 参 数 分 布 ， 其 生存 函数 为 : 


S(t) = et, zz0,9g>0 (2.2.7) 
其 概率 密度 函数 为 : 
f(t) = 9 eit (2. 2. 8) 
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其 危险 率 函 数 为 : 


_ AKC 1 
谍 让 0 部 (2. 2.9) 


因为 179 为 常数 ， 所 以 在 精算 教材 中 称 其 为 常 值 死亡 力 。 

指数 分 布 的 特点 是 历史 地 位 重要 、 数 学 形式 简单 ， 并 且 具 有 许多 重要 
性 质 。 

第 一 ， 无 记忆 性 。 即 

P(T>=1:+y|T=1) = PT 三 7y) (2. 2. 10) 

这 一 性 质 使 得 它 在 数学 上 易于 处 理 ， 但 也 限制 了 它 在 可 靠 性 研究 领域 的 
应 用 。 

由 于 无 记忆 性 , E(T-i|T1) = E(T) = 9 ， 即 剩余 寿命 均值 为 常数 。 
由 于 未 来 发 生 某 事件 的 时 间 与 历史 记录 无 关 ， 无 记忆 性 有 时 也 称 做 “不 老 
化 ”， 指 数 分 布 的 危险 率 为 常数 也 体现 了 这 一 性 质 。 因 此 ， 尽 管 历史 上 指数 
分 布 很 受 欢迎 ， 但 在 健康 领域 和 工业 领域 ， 其 常数 危险 率 的 限制 显得 过 于 
苛刻 ， 不 适合 用 做 长 时 间 段 的 人 口 生 存 模 型 ， 而 是 用 于 短 时 间 区 间 段 ， 如 1 
年 。 





第 二 ， 指 数 分 布 的 均值 和 标准 差 都 是 96， 中 位 数 是 6 in2。 

第 三 ， 指 数 分 布 是 韦伯 分 布 各 伽 玛 分 布 的 特例 。 

由 于 人 口 生 存 模 型 很 少 使 用 均匀 分 布 或 指数 分 布 来 拟 合 ， 因 此 我 们 用 
7 而 不 是 用 天 来 作为 死亡 时 间 随 机 变量 。 在 下 面 的 分 布 中 ， 将 用 天 表示 和 死 
亡 时 间 随 机 变量 。 


2.2.3 Gompertz 分 布 
Gompertzd 于 1825 年 提出 将 该 分 布 视 为 人 口 生 存 模型 ， 其 危险 率 定义 为 : 


h(x) = Be’, XX 宇 0,B>0,c>l1 (2.2.11) 
那么 ， 生 存 郴 数 为 : 
S(x) = ed 三 exp (TI 一 c) ) (2.2. 12) 
ln c 


其 概率 密度 函数 为 h(x). S(x)。 显然 其 数学 表达 式 不 简洁 ， 且 分 布 的 期 望 
也 不 易 求 得 。 


2.2.4 Makeham 分 布 
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Makeham@ 于 1860 年 对 Gompertz 分 布 进行 了 修正 ， 其 危险 率 函 数 为 : 


@ 参见 Gompertz, B. “On the nature of the function expressive of the law of human mortality” , Phil Trans 
Royal Soc,. London 1825, 115: 513 ~ 583. 

@ 参见 Makeham, W. M. , “On the Law of Mortality and the Construction of Annuity Tables” .J. Inst. Actuar- 
ies and Assur Mag. 1860, 8: 301 -310. 


h(x) = A+Be’, xX 宇 0,B >0,c>1,4 >-B (2. 2. 13) 
Makeham 分 布 假设 任意 年 龄 的 危险 率 存在 与 年 龄 相互 独立 的 部 分 ， 因 
此 在 Gompertz 分 布 的 危险 率 基 础 上 加 了 一 个 常数 A。 
Makeham 分 布 的 生存 天 数 为 : 


SCxz) = exp (TC _ 01) - 4z] (2. 2. 14) 


显然 ， 对 这 个 分 布 的 概率 密度 函数 、 概 率 分 布 函数 、 矩 等 数字 特征 进 
行 数学 处 理 也 比较 困难 。 


2.2.5 韦伯 分 布 
这 一 分 布 的 生存 晴 数 为 : 
S(x) = e379, xy>0,9>0,y>0 (2. 2. 15) 
这 里 9 是 尺度 参数 或 规模 参数 ,yy 是 形状 参数 。 指 数 分 布 是 韦伯 分 布 当 
y = 1 时 的 特例 。 图 2 -4 给 出 各 种 韦伯 生存 联 数 的 形状 。 
韦伯 分 布 的 危险 率 函 数 具 有 非常 灵活 的 形式 : 


h(x) = Be, >0,06>0,y>0 (2. 2. 16) 


图 2 -5 给 出 各 种 韦伯 危险 率 曲 线 。 





ee 0=1.1,Y =1.2 
—— 90=1.l,y =l 
一 ~ 一 0=1.1 ;y =0.7 


A 


图 2-4 韦伯 生存 函数 图 2-S 韦伯 危险 率 函 数 


从 图 2-5 可 以 看 出 ， 韦伯 分 布 非常 灵活 ， 可 以 适用 于 危险 率 递 增 〈 取 >y > 
1)、 递 减 ( 取 7y <I) 和 为 常数 〈 取 7y =1) 等 各 种 情形 。 由 于 这 个 原因 ， 
加 上 韦伯 分 布 的 生存 沙 数 、 和 危险 率 函 数 和 概率 密度 本数 形式 相对 简单 ， 使 
得 它 成 为 应 用 非常 广泛 的 参数 模型 。 

对 于 韦伯 分 布 ， 还 有 如 下 结果 : 


f(x) = ee xx > 0 (2. 2. 17) 


E(X') = oT|(1 + 二 | (2. 2. 18) 
Y 
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E(X) = O°T(1+ | (2.2. 19) 


Var(X) = orll | 一 [erla + 二 )] (2. 2. 20) 


其 中 , F(a) = | ee 是 著名 的 伽 玛 函 数 ， 伽 玛 函 数 的 递 推 公式 为 


T(a) = (waw-1)FGa-1) 。 当 a 为 整数 时 ,TT(a) = (ae-1)1; 当 a 不 是 
整数 时 ， 可 见 Beyer 于 1968 年 编制 的 伽 玛 函数 取 值 表 。 

我 们 在 这 一 节 学 习 了 五 个 参数 生存 模型 。 在 实际 运用 中 ,没有 哪个 模 
型 可 以 准确 涵盖 人 的 整个 生命 周期 ， 我 们 通常 可 以 在 某 个 年 龄 段 利 用 理论 
模型 给 出 适当 的 拟 合 。 


$2.3 条 件 随 机 变量 的 分 布 


在 初始 时 刻 : = 0 时 ， 如 果 个 体 的 年 龄 x = 0 ,那么 死亡 的 概率 为 
F(x) ,生存 的 概率 为 S(x) 。 这 两 个 概率 是 无 条 件 的 ， 因 为 我 们 假定 在 x = 0 
时 所 有 被 研究 对 象 都 活着 。 但 构造 生存 模型 必须 考虑 各 个 年 龄 的 群体 ， 因 
为 样本 可 以 在 任何 时 候 进 入 该 群体 。 因 此 我 们 需要 考虑 ， 在 被 研究 对 象 在 x 
岁 还 活着 、 从 年 龄 x 岁 开 始 仍然 生存 或 死亡 的 概率 ， 即 条 件 生 存 郑 数 或 条 
件 分 布 函数 。 
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如 果 某 人 在 x 岁 生 存 ， 他 在 nn 年 后 仍 生存 的 概率 用 ,p, 表示 ， 那 么 有 


_ S(x +n) 
by = S(x) 


对 应 的 死亡 概率 用 为 .g. 表示 ， 则 


‘9. = 1 rp = 区 全 人 (2.3.2) 


(2.3.1) 


这 里 需要 注意 的 是 条 件 概率 .p. 与 非 条 件 概率 S(n,x) 的 区 别 。 二 者 都 
表达 了 x 岁 的 人 活 到 (x + n) 岁 的 概率 ， 当 已 知 条 件 是 生存 函数 S(x) 时 ， 


它 是 有 条 件 的 ， 即 .2. = 3 各 + ， 当 已 知 条 件 是 选择 生存 函数 S(454) 时 ， 


它 是 无 条 件 的 ， 直 接 由 S(n;x) 求 出 ， 记 为 ,pro。 
同 理 ， 确 定 x 岁 的 人 在 (* +z) 岁 前 死亡 的 概率 时 ， 当 已 知 条 件 是 生存 


函数 5(*) ， 它 是 有 条 件 的 ， 即 ,9. = 67+， 当 已 知 条 件 是 选择 


生存 泪 数 S(t;x) 时 ， 它 是 无 条 件 的 ， 直 接 由 F(n;x) 求 出 ， 记 为 qu。 
【 例 2-3】 已 知 选择 生 存 函数 S(4*) ， 求 所 选取 的 x 岁 的 人 活 到 (x + 
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10) 岁 ， 并 在 (x + 20) 岁 前 死亡 的 概率 。 
解 : 所 求 的 概率 实际 上 是 (x + 10) 的 人 在 10 年 内 死亡 的 概率 ， 即 
104d [zi+103 那么， 


S(20;x) 
S(10;x) 





10df:jxlo 二 1 10Prz]1:10 = Ls 


2.3.2 于 的 下 载 履 分 布 

对 于 初始 时 刻 年 龄 既定 的 个 体 ， 设 其 年 龄 为 y， 在 对 其 进行 生存 分 析 
时 ， 需 要 考虑 大 于 y 的 随机 变量 X 的 分 布 ， 称 之 为 在 y 处 下 截 尾 的 X 的 
分 布 。 

当 * > y 时 ， 这 个 条 件 变量 的 生存 函数 为 : 


人 


P(X >7y) SC7) 
分 布 函数 为 : 
Pl(y <X <x) F(x) — Fl(y) 


F(x|X >7y) = P(X <x|X>y) = 一 一 一 一 一 一 -= 





P(X > y) 1 ~ F(y) 
(2.3.4) 
特殊 地 ， 有 
S(yt+n|X>7y) = P(X>y+n|X>y) =,p, (2.3.5) 
F(x+n|X >x) =P(x <X<x+n|X>x) =,g, (2.3.6) 


式 (2.3.3) 和 (2.3.4) 给 出 了 工 在 y 处 下 截 尾 的 条 件 变量 的 生存 函 
数 和 栋 积 分 布 函数 ， 下 面 考虑 条 件 概 率 密 度 函 数 。 我 们 用 ARx | > y) 表示 
y 岁 的 人 在 x 岁 死 亡 的 条 件 密 度 ， 那 么 ， 





有 _ ZTECz) - FO(Y)] ,f(x) 
f(s|X >7) = EF(s|X>y) = a 
即 f(x|X >y) = 人 (2.3.7) 


最 后 ， 对 于 y 岁 时 生存 的 个 体 ， 他 在 % 岁 时 的 危险 率 函数 h(x|X > y) ， 有 
el) NAST): OE 


S(x|X >y) SC(x)/S(y)  S(x) 
(2.3.8) 
总 之 , S(x|X >y) 、F(x| 革 >Y) 和 f(x|X > y) 部 是 描述 了 在 y 处 下 
截 尾随 机 变量 的 基本 函数 ， 至 于 h(x|X > y) = h(x), 则 完全 是 由 于 危险 率 
函数 的 定义 所 致 。 


2 让 的 双 息 属 分布 


我 们 再 来 考察 一 种 更 为 普遍 的 情况 ， 即 初始 时 刻 y 岁 的 个 体 ， 在 其 死 
亡 年 龄 不 超过 z 的 条 件 下 ， 对 其 进行 生存 分 析 。 也 就 是 说 ， 需 要 考虑 在 六 


落 在 y 与 z 之 间 的 条 件 下 ， 壮 的 分 布 ， 称 之 为 在 y 和 z 处 双 结 尾 的 处 的 分 布 。 
这 时 ， 双 截 尾随 机 变量 的 生存 函数 S(x |y < 无 三 z) 表示 当 死 亡 年 龄 蕊 落 在 
y 与 z 之 间 ， 死 亡 在 * 岁 以 后 发 生 的 概率 ， 有 

S(x|y <X<z) = P(X >x|y<X<2z) 


= P(x <X<z|y<X<2z) 





_ S(x) — S(z) 
~ 5(y) 二 5(z) Co 
相应 的 分 布 函 数 为 : 
F(x|y <X<z) = Pl(y <X<xrx|y<X<2z) 
_ F(x) ~ F(y) 
~ F(z) = FO) ee 
概率 密度 也 数 为 : 
flx|y <Xe2z) = -ES(x|y < Xz) 
-dlS(x) - S(z) 
dxl S(y) — S(z) 
f(x) 
= yr (2.3.11) 
可 flx|y <X<2z) 
kx 17 村 ~ S(x|y < z) 
和 f(x)/[LS(y) - S(z)] 
[SC(x) -~ S(z)]/[LS(y) - S(z)] 
_ f(x) 
= S72) — Sz) (2.3. 12) 
青 把 f(x) = h(x):. S(x) 代入 式 (2.3.12)， 有 
区 _ h(x)S(x) 
h(x|y <X<z) ey a (2.3.13) 


比较 式 (2.3.8) 与 式 (2.3.13), 可 以 看 出 ,， 截 下 尾 不 影响 危险 率 函 
数 ， 而 截 上 尾 却 对 其 有 影响 。 直 观 来 看 ， 堆 上 尾 的 影响 在 于 个 体 未 来 生存 的 
时 间 缩 短 了 。 由 式 (2.3.13) 可 知 ， 当 z 一 x 时 ,h(x|y < 针 乓 2) 一 +%。 


2.3.4 截 尾 分 布 的 答 
X 的 双 截 尾 分 布 的 一 阶 矩 为 ; 
E(X|y <X<2) = | «f(rly <X< zd (2. 3. 14) 


特别 地 ， 


E(X|X > y) = 人 zz|X> 7)dz (2.3. 15) 


* 
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只 要 上 面 的 积分 存在 。 
由 于 式 (2. 3.15) 表示 y 上 岁 的 人 死亡 时 的 平均 年 龄 ,因此 E(X|X > y) -~ 
y 就 表示 这 个 人 的 剩余 寿命 均值 ， 用 e, 表示 ， 其 含义 与 2.1.3 中 的 el 相似 ， 
只 不 过 el 强调 选择 年 龄 为 x。 
这 里 有 
e, = E(X|X>7y)-y (2.3. 16) 


又 因为 | f(z|X>y)dx=1， 则 


2 = 人 (x-DAx|X > y) dr 


= fty|x > 7 二 (2. 3. 17 ) 

进一步 ， 如 果 二 阶 窍 存在 ， 则 
E(X |X > 7y) = 大 x -f(x|X > y)dx (2.3.18) 

从 而 y 岁 人 未 来 寿命 的 方差 为 : 
Var(X¥~y|X>7y) =Var(X|X>Y) =E(X|IX>y)-[E(F|IX > 
(2.3.19) 


用 m, 表示 。 它 定义 为 单位 区 间 上 危险 率 函 数 的 加 权 平 均值 ， 权 重 是 生存 本 
数 ， 有 
[sh dy 


mm, = - x+l (2. 3. 20) 
| SC7) dy 


更 一 般 地 ， 我 们 用 ,.m, 表示 区 间 (x, x + nj] 上 的 中 心 死 亡 率 : 


[shCy) ay 
Mm = 二 -一 一 一 一 (2.3.21) 
| sy)ady 
我 们 将 在 下 一 章 对 ,m, 进行 详细 讨论 ， 并 利用 它 来 估计 表格 生存 函数 。 
【 例 2-4】 证 明 : 车 X 服 从 指数 分 布 ， 则 m, = - ln p,。 
证 明 : 因为 X 服 从 指数 分 布 ， 则 危险 率 函 数 h(y) = 1/0 。 
由 式 (2.3.20)， 有 
六 .人 SCy)ay 


三 sr) 必 
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_S(x+1) eslx+!) -eo 1 
~” S(x) -x ’ 0 


e 


再 由 P。 





$2.4 多 元 生存 模型 


前 面 三 节 我 们 在 对 生存 时 间 随 机 变量 7 分析 时 ， 仅 考虑 了 死亡 这 一 决 
定 未 来 生存 时 间 的 因素 ， 在 实际 中 ,往往 需要 考虑 多 种 影响 个 体 未 来 生存 
或 存续 时 间 的 因素 ， 比 如 解约 、 退 体 、 残 疾 及 期 满 等 。 我 们 把 只 考虑 死亡 
这 一 影响 因素 的 生存 模型 称 为 一 元 生存 模型 、 一 元 衰减 模型 或 者 单 减 因 生 
存 模型 ， 把 考虑 多 种 影响 个 体 未 来 存续 时 间 因 素 的 模型 称 为 多 元 生存 模型 、 
多 元 衰减 模型 或 者 多 减 因 模 型 。 在 多 元 生存 模型 中 ， 把 个 体 未 来 生存 时 间 
称 为 存续 时 间 ， 把 个 体 由 于 死亡 、 解 约 、 退 体 、 残 疾 及 期 满 等 因素 造成 退 
出 称 为 个 体 终止 或 个 体 衰减 ， 同 时 ， 仍 设 个 体 的 初始 年 龄 为 x。 





2. 4.1， 存 续 时 间 与 减 因 的 联合 分 布 与 边缘 分 布 
我 们 仍 将 个 体 的 未 来 存续 时 间 记 为 7， 表示 个 体 从 初始 时 刻 : = 0 开始 
直至 终止 的 时 间 ; 导致 个 体 终 止 的 衰减 因素 或 减 因 记 为 ,J 是 离散 随机 
变量 。 
假设 随机 变量 7 与 的 联合 概率 密度 函数 为 f(i, 站), :二 0,j =1,2,-…， 
m ， 企 体 由 于 减 因 7 在 时 刻 上 前 终止 的 概率 为 P(T <t, J=j) ， 记 做 ,qa”， 有 


‘go = PATEt TD = fs Dd sm0, j=1,2,,m 
(2.4.1) 
同 理 ， 把 个 体 由 于 减 因 j 终止 的 概率 记 为 .g” ， 则 有 
.gqg? = P(T < o,J= 门 = [fls, Das, j=1,2,.,m 
(2.4.2) 


式 (2.4.2) 就 是 随机 变量 的 边缘 分 布 函 数 ， 记 为 r(j) ， 即 

r(j) =。q2% = | fCs, Das, j=1,2,.……,m (2.4.3) 
个 体 在 时 刻 i 前 终止 的 概率 ， 即 不 论 何 种 因素 终止 的 概率 记 为 ,ql*” ， 有 

4 = PT < = Bl, Da (2.4.4) 


式 (2.4.4) 就 是 随机 变量 7 了 的 边缘 分 布 蚂 数 ， 进 一 步 ， 把 个 体 在 时 刻 
i 仍 存 续 的 概率 记 为 ,p'”， 称 之 为 存续 函数 ， 有 
Pps” =1-,g" (2.4.5) 
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事实 上 ， 若 把 7 的 边缘 密度 函数 记 为 g(t) ， 则 g(t) = 于 Ki ， 把 
7 的 边缘 分 布 函 数 记 为 C(!) ,那么 ， 
c(D = ea = Bf, Dds = Ff, Nas = 


(2.4.6) 
即 个 体 在 时 刻 i 前 终止 的 概率 ， 得 到 了 与 式 (2.4.4) 相同 的 结果 。 
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类 似 于 单 减 因 生存 模型 ， 在 多 减 因 生存 模型 中 ， 我 们 把 个 体 在 x + 上 岁 
的 危险 率 函 数 定义 为 : 


站 CC _ g(t) 
he = TO rr (2.4.7) 


hs 表示 在 x 岁 的 个 体 在 存续 了 时 间 上 后 的 终止 密度 。 
由 式 (2.4.5) 和 式 (2.4.4)， 有 





1 d 1 d d 
he Ez ps ee ge > (2.4.8) 
由 (2. 4.8) 式 可 解 得 : 
PCD = ee (2.4.9) 
我 们 再 把 由 训 减 因素 导致 个 体 在 x + 上 岁 终止 的 危险 率 函 数 定义 为 : 
得 f(t,7) 
ha, Te G(i) (C2: 4. 10) 


自然 地 ， 我 们 有 





0 

hn, = a 去 一 全 人 C2 
又 由 定义 ， 有 

95” = 了 oo (2.4.12) 
把 式 (2. 4. 12) 两 边 对 i 求 导 并 除 以 , p'” ， 得 到 

he = > hi (2.4. 13) 
式 (2.4.12) 和 “(2.4.13) 表明 ， 由 各 种 减 因 导致 个 体 终止 的 概率 和 危险 
率 函 数 都 具有 可 加 性 。 

根据 由 减 因 j 导致 个 体 在 x + i 岁 终止 的 危险 率 函 数 的 定义 ， 有 
fl1,7) =,.p" ho (2.4. 14) 


再 由 了 的 边缘 密度 函数 g(t) 的 定义 可 得 : 
g(t) = THD = Tp eh ,pn PhD =, ph? 


(2.4.15) 
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个 体 在 1 时 刻 终止 的 条 件 下 ,J 的 条 件 密度 肾 数 为 : 


A ee 
CD pp Be 





(2. 4. 16) 
至 此 , 式 (2.4.14)、(2.4.15)、(2.4.12) 和 (2.4.16) 把 T 和 J 的 联合 
概率 密度 函数 、 边 缘 密 度 函 数 、 边 缘分 布 函 数 和 条 件 分 布 晒 数 都 用 精算 符 
号 表示 出 来 。 


2.4.3 联合 单 减 因 生存 模型 

在 单 减 因 生 存 模 型 中 ， 我们 仅 考虑 死亡 风险 导致 个 体 在 一 定时 间 内 
终止 的 概率 ; 而 在 多 减 因 生存 模型 中 ， 由 于 各 种 衰减 因素 同时 发 生 作 用 ， 
因此 某 种 衰减 因素 导致 状态 终止 的 可 能 性 会 因 其 他 减 因 的 存在 而 改变 ， 
我 们 称 这 些 影 响 状态 终止 且 相 互 作用 的 衰减 因素 为 竞争 性 减 因 。 在 竞争 
性 减 因 的 条 件 下 ， 我们 只 能 看 到 这 些 减 因 对 个 体 终 止 产生 的 总 作用 ,而 
很 难看 到 某 个 减 因 的 单独 作用 。 为 了 考虑 各 种 减 因 的 单独 作用 对 存续 函 
数 , p:” 和 终止 概率 ,q:” 所 造成 的 影响 ,我 们 可 以 就 特定 的 减 因 定义 单 减 因 
生存 模型 ， 该 模型 只 依赖 这 个 特定 的 减 因 ， 多 个 单 减 因 的 总 和 称 为 联合 
单 减 因 模 型 。 

在 考虑 第 j 个 减 因 的 单独 作用 时 ， 相 应 的 危险 率 函 数 h? 是 最 基本 的 因 
素 。 在 危险 率 函 数 h” 的 基础 上 ， 我 们 定义 其 他 函数 。 

首先 定义 联合 单 减 因 模 型 的 存续 函数 为 : 


2 (2.4. 17) 
它 表 示 个 体 在 上 时 刻 前 仅 受 第 7 个 减 因 影 响 所 致 的 存续 概率 。 再 定义 
加 莹 了 —,p" (2.4.18) 


称 为 独立 终止 率 。 自 然 地 ， 它 表示 在 没有 其 他 减 因 影响 时 ， 由 第 /个 减 因 导 
致 个 体 在 上 时 刻 终 目的 概率 。“ 独 立 ” 一 词 的 使 用 ， 导 在 强调 在 确定 ,g2 
时 ， 只 考虑 减 因 j 的 作用 而 不 考虑 其 他 减 因 的 影响 。 为 了 区 别 在 多 减 因 生存 
模型 中 由 减 因 j 导致 个 体 在 1 时 刻 前 终止 的 概率 ,gq ， 我 们 对 ,gq 使 用 终止 率 
而 不 用 终止 概率 。 
关于 2 、g” 和 495 的 大 小 ， 有 如 下 关系 : 
gq” < gq < gq (2.4.19) 
我 们 先 来 考虑 第 一 个 不 等 式 。 直 观 上 来 看 ， 单 纯 由 第 j 个 减 因 导 致 个 体 
在 一 年 内 终止 的 独立 终止 率 g2 会 因 其 他 减 因 的 作用 ( 先 于 减 因 j 发 生 ) 而 
减 小 。 而 事实 上 ， 由 式 (2.4.9) 和 (2.4.17) 可 知 : 


: : ge 
,ip = ee = eh ys -TTY (2. 4. 20) 
上 
j=1 


*“ 21 . 


精算 模型 


. 22 . 


因此 , p2 =,po2， 加 之 2 二 0 ， 所 以 ， 
pe hi, ,ph (2.4.21) 
式 (2.4.21) 两 端 从 0 到 1 积分 全 得: 
1 
dg = | DhD a = phd de = go 


另 一 方面 ， 我们 又 有 
go -1 -DO <1 本 gq" 
这 说 明 个 体 的 独立 终止 率 会 因为 减 因 j 之 外 还 有 其 他 减 因 的 作用 而 增 大 至 
(7) 
d: 0 
对 应 于 一 元 生存 模型 中 的 中 心 死 亡 率 ， 在 多 元 豪 减 模型 中 ， 我们 定义 
全 中 心 终止 率 为 : 
[pM ha 
坟 A , (2.4.22) 
[pdt 


它 是 危险 率 函 数 h'? 在 x 到 x+1 上 的 加 权 平 均值 ， 对 应 于 减 因 j 的 中 心 终止 
率 定义 为 : 


fn hd ,DC ho dt 
mD = (2. 4.23) 
fpr dz 
它 是 危险 率 函 数 h 在 x 到 x +1 上 的 加 权 平 均值 。 显 然 ， 
2 了 m0 (2. 4. 24) 
在 联合 单 减 因 模型 中 ， 定 义 独立 中 心 终止 率 为 : 
J ip ha 
m= 二 一 一 一 一 (2. 4. 25 ) 
[pl de 
它 是 危险 率 函数 hk 中 在 x 到 x + 1 上 的 加 权 平 均值 , 但 权 数 是 ,p.” 而 不 


是 ,p'”。 

【 例 2 -5】 在 一 个 二 元 衰减 模型 中 , 已 知 22 岁 的 个 体 2 年 后 的 存续 
概率 为 0.39，24 岁 的 个 体 1 年 内 由 减 因 1 所 致 终止 的 概率 为 0.45，3 年 内 
由 减 因 2 所 致 终止 的 概率 为 0.52， 计算 : 

(1) 22 岁 的 个 体 24 岁 时 在 1 年 内 由 减 因 1 所 致 终止 的 概率 ; 

(2) 他 3 年 内 由 减 因 2 所 致 终止 的 概率 。 

解 : (1) P =,pi gt? = 0.39 x0.45 = 0.1755 

(2) P =,pl" ,gh = 0.39 x0.52 = 0.2028 汪 
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型 相应 的 函数 。 

由 于 这 种 转换 涉及 个 体 在 相 邻 整数 年 间 终 止 分 布 的 假设 ， 因 此 我 们 把 
这 里 用 到 的 假设 以 及 相应 的 结论 列 在 这 里 ， 其 具体 的 证 明 参 见 $3.2。 

在 危险 率 函 数 恒定 的 假设 下 ， 有 hh" = -lnpm ,ph =-lnp.” ,j=1, 

在 终止 服从 均匀 分 布 的 假设 下 ， 有 .44” =iq"”,,g” =19 ,0<1t<1,j= 
1,2，… ,下 (Ph =,p hi,=g ,j= 1,2,.,mo 

在 多 减 因 模 型 中 ， 先 假设 对 应 于 各 减 因 的 危险 率 函 数 在 各 年 龄 区 间 内 
均 为 常数 ， 即 


2 











hn = hn, Ot<1;j=1,2,.…,m (2. 4. 26) 
这 时 也 有 
h?) = h", 0< 上 <1 (2. 4. 27) 
于 是 可 得 : 
1 ho 1 
(D) 三 DOF = x np ;yj 
9- 人 x t 天 直人 t 
ln pe 
一 a (2.4. 28 ) 
由 式 (2.4.28) 可 解 得 : 
We ql)) 
dg Ea WR (1 一 qg0 ) 5 (2. 4. 29 ) 
再 假设 各 种 终止 事件 的 发 生 在 各 年 龄 区 间 服 从 均匀 分 布 ， 即 
.99 =19 ， Oi:<1;j =1,2,.…,m (2. 4. 30) 
因此 ， 
,4 = tg, O<sri<l1 (2.4.31) 
由 式 〈2. 4.12) ， 有 
1 a 1 d i 
ph? i A 0 全 (人 
+ 0 qd; 1 sq" i 4: ) 
(7) 
i (2. 4. 32) 
所 以 ， 
ynR qd) 40 0) 
gq? = 1 eh = 1 -elem = 1 edn) 1 -qn ) a 
a 
即 da0 =1-(1-g") (2. 4. 33) 


比较 式 (2.4.29) 和 (2.4.33)， 可 见 在 这 两 种 假设 下 ,根据 终止 概率 算 


.23. 


.24 ， 


得 的 独立 终止 率 是 相同 的 。 : 

我 们 接着 考虑 由 联合 单 减 因 模 型 的 生存 分 析 函 数 转 换 成 多 元 衰减 模型 
的 函数 。 在 多 元 训 减 模型 中 ， 无 论 危 险 率 郑 数 在 各 年 龄 区 间 内 均 为 常数 ， 
或 各 减 因 在 各 年 龄 区 间 服 从 均匀 分 布 ， 都 有 式 (2.4.28)， 把 式 (2. 4. 20) 
代入 式 (2.4.28)， 有 


ln 2 
gm = 和 (1 - II 亲人 加 ) 


0 
_ lIn (1 -dg ) (1-0 -2) (2. 4. 34) 


bp ln (1 __ gq”) Fl 


由 式 (2.4.34) 可 以 根据 独立 终止 率 计算 终止 概率 。 

但 是 , 式 (2. 4.34) 要 求 pz 关 0(01 =1,2,…,m) 。 当 p”=0 或 p"” 
= 0 时 ， 就 需要 考虑 其 他 方法 。 

一 种 适合 处 理 这 种 不 确定 性 的 方法 是 改变 假设 ， 比 如 假设 联合 单 减 
因 模 型 中 终止 事件 的 发 生 在 各 年 龄 区 间 内 服从 均匀 分 布 ， 而 不 是 如 上 所 
假设 的 多 元 风险 模型 中 各 终止 事件 的 发 生 在 各 年 龄 内 服从 均匀 分 布 ， 这 
样 ， 有 


9 = tg, Os<t<1;j=1,2,.…,m 
‘Wm dg) _ d(tg”) .0 
从 而 Pr ho = dt 一 dt Wt gq” S (2. 4. 35) 





1 1 
于 是 有 99 = [pV haD di = [| pr di 
0 0 i 


= g,” fe IT (1 - ta )ae (2. 4. 36) 

式 (2. 4.36) 中 被 积 函 数 是 一 个 关于 :的 多 项 式 ， 可 以 直接 进行 积分 运算 ， 
但 在 m 较 大 时 计算 比较 繁 珊 。 

比较 式 (2.4.29)、 (2.4.34) 和 (2.4.36)， 无 论 是 计算 v2 ,还 是 
计算 92 ， 运算 都 比较 复杂 ， 因 此 有 必要 寻求 近似 的 方法 来 简化 计算 。 

第 一 ,在 多 减 因 模 型 中 ， 当 对 应 于 各 减 因 的 危险 率 函 数 在 各 年 龄 区 间 
内 均 为 常数 时 ， 有 
fp pod [pr ha 


mo = ho (2. 4.37) 





1 > 1 
fra pa 
0 0 
同 理 也 有 
fh gs 
2 0 


= ho (2. 4. 38) 
“OD dt 
1 


m 
z 
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一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 

因此 有 

mY = 7 人 (2. 4. 39 ) 
一 般 情 况 下 ， 有 

mY ~ me (2.4. 40) 

第 二 ， 若 各 终止 事件 的 发 生 在 各 年 龄 区 间 内 服从 均匀 分 布 ， 则 
(Ty S 
ps hdt 0 0) 
mW = en = EE ee (2.4.41) 





1 
1 pda [ (1 -tig )d 1-74 


第 三 ， 车 各 联合 单 减 因 模 型 中 终止 事件 的 发 生 在 各 年 龄 区 间 内 服从 均 
匀 分 布 ， 则 
‘Dr 
Pp. hodt ‘0) ‘(0)) 
mm = | . = 一 2: 加 人 (2.4.42) 
fpY ad | (1 - tq ) dz 下 三 px 
事实 上 ， 第 二 个 假设 与 第 三 个 假设 是 有 差异 的 ， 因 为 第 二 个 假设 意味 着 
,p0=1-12， 而 第 三 个 假设 意味 着 ,p =,p0 ,pe ,po = (1 -1 妇 0) 
(1 -te)(L-12 )， 这 说 明 这 两 个 假设 并 不 等 价 ， 但 是 出 于 近似 的 考虑 ， 
我 们 仍 可 令 








(站 “( 门 
全 二 和 (2. 4. 43) 
1 Lo" 1 -oo 
于 人 元 


分 别 就 9 和 42 解 得 : 


g 0 ~ gd: (2. 4.44) 
下 过 二 (go do ) 
q2(1 a ;») 
dg (2. 4. 45 ) 
二 < —g (让 
2 4 


式 (2.4.44) 和 (2.4.45) 只 涉及 简单 的 四 则 运算 。 

【 例 2 -6】 在 有 两 个 减 因 的 模型 中 ， 已 知 m9 = 0.2,40 = 0.1 ， 在 
下 列 假设 下 计算 gq : 

(1) 多 减 因 生存 模型 中 ， 各 个 终止 事件 的 发 生 在 各 年 龄 区 间 内 服从 均 
匀 分 布 ; 

(2) 联合 单 减 因 生存 模型 中 ， 各 个 终止 事件 的 发 生 在 各 年 龄 区 间 内 服 
从 均匀 分 布 。 

解 : 

(1) 由 假设 可 知 m = 一 下 = 0.2 ,得 4 = 


De 11 
1 -74 


。29 。 
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， 26， 


gee) 


由 gw =1-(1- do ) 闹 得 gq' = 0.09546 
再 由 gi = gl +90 可 得 g9 = 0.08636 


(2) 


940 
因此 ,gg2 =1-[1-gm] = 0.090916 
(2) 由 已 知 可 知 mm 和 + m2 = mm 人 ， 所 以 ， 


1 
(7) (1) (7) yp (2) 
.pl hid 示 pO hid 
0 








1 = 0. 2 
pd | pi di 
民 [ 
1 
2 ps dt 站 pr dt "(1) "(2) 
0 0 dao dso 
ml 
/ ps pa dt 「 ps ps di | ps di 「 ps dt 
“(1) "(2) 
= Gao 了 d40 -02 
1 _ 工人 1- 7 2) 
2 44 do 
经 计算 可 得 gq = 0.09045 。 
习题 


1. 生存 函数 Si) = 0.1 x (100 -1)7, 0 三 1 三 100 ， 求 下 列 各 值 : 

(1).A36) ; (2) h(50) ; (3) H(75) ; (4) E(T) ; (5) Yar(7) 。 

2. 假设 生存 函数 为 S(x) = ax +8;0 二 xx 二 上 , 若 下 的 期 望 为 60， 求 六 
的 中 位 数 。 

3. 起 | 和 已 为 相互 独立 的 随机 变量 ， 定 义 随 机 变量 了 = min ( 马 ,已 ) 与 
Z = max (基肥 ) 。 

(1) 证 明 工 的 生存 函数 为 已 与 已 的 生存 函数 的 乘积 ; 

(2) 证 明了 的 累积 分 布 函 数 为 已 与 闷 的 累积 分 布 函数 的 乘积 ; 

(3) 证 明 若 忆 、 妃 都 服从 指数 分 布 ， 则 了 也 服从 指数 分 布 ， 但 2 不 服 
从 指数 分 布 。 
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4. 已 知 S(x) = (1 - 165) ,0 三 x < 100 ， 试 求 (75) , f(75) 和 


h(75) 。 

5. 记 。qg = S(m) -S(m +1) 为 在 初始 时 刻 上 = 0 生存 的 个 体 在 上 = m 
至 =m +1 间 死亡 的 概 府 。 试 确定 ， 当 了 为 下 列 分 布 时 ,1g6 是 到 的 增 函 
数 、 减 函数 还 是 常数 函数 ? 

(1) 均匀 分 布 ; (2) 指数 分 布 ; (3) f(t) = 0.00125i, 0 三 上 友 40 
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6. 令 S(x) =ax+b,0 夺 x 三 上 , 若 已 知 , po。 =0.075， 求 ,m,。 

7. 对 于 某 一 实验 设备 ， 其 生存 分 布 为 在 t=5 和 如 =15 双 截 尾 的 指数 
分 布 ， 参 数 6=0.02， 求 该 试验 设备 未 来 寿命 的 中 位 数 。 

8. 车 S(x) =1-(0.0lx) 六 ,0 反 x 反 100 ， 求 中 位 数 年 龄 时 的 未 来 预期 寿命 。 


9. 假设 一 类 下 截 尾 分 布 的 分 布 函数 为 S(x) = exp| -至 ] ， 一 co <X < 十 oo 


(1) 证 明 著 截 去 % = 0 以 下 的 分 布 ， 该 分 布 就 是 Gompertz 分 布 ; 

(2) 比较 未 截 尾 分 布 的 危险 率 函 数 和 Gompertz 分 布 的 危险 率 函 数 。 

10. 某 项 调查 针对 50 ~55 岁 男 子 的 死亡 认 ， 观察 的 样本 数量 为 n， 观 
察 时 间 从 样本 50 岁 生日 开始 ， 直 到 死亡 或 者 存活 到 55 岁 ， 假 定 危险 率 函 
数 户 (t) 的 形式 如 下 : 

h(t) =a+Bt(a >0,B >0 是 要 估计 的 参数 ,+t 是 50 岁 以 后 的 生存 整 年 ) 

(1) 推导 50 -55 岁 的 生存 函数 ; 

(2) 画 出 该 生存 函数 图 ， 并 评价 危险 率 函 数 在 这 个 年 龄 范围 上 的 合 
理性 。 

11. 已 知 某 两 减 因 生 存 模 型 满足 以 下 条 件 : (1) gg = 2qg0 ; (2)g + 
4 = 4 +0.18 。 试 计算 go 。 

12. 假设 gq = 0.15 ,dg = 0.03 ， 如 果 减 因 1 的 联合 单 减 因 表 均匀 分 
布 假设 ,而 减 因 2 集中 发 生 在 每 个 年 龄 的 中 间 ， 试 计算 : (1),p"”, 0<i< 
1; (2) gq ,gq 。 

13. 某 公 司 员 工 李 先生 ， 年 龄 为 50 岁 。 假 设 这 个 公司 员工 的 寿命 规律 
服从 一 个 双 减 因 模 型 : 

(1) 减 因 1 是 退休 。 

0.00,，0<i<5 
1 02, St 

(3) 减 因 2 是 其 他 所 有 非 退 休 原 因 ， 从 而 停止 在 这 个 公司 工作 。 

(4) he = pe 0O<i<5 

; 0.03， 5 三 “| 

(5) 如 果 李 先生 停止 工作 并 离开 此 公司 ， 那 么 他 不 会 重新 加 入 该 公司 。 
计算 李 先 生 将 会 在 60 岁 之 前 退休 离开 该 公司 的 概率 。 

14. 一 个 双 减 因 模 型 的 信息 如 下 : 

(1) u(t) = 0.2u"(t),t >0 

(2) p(t) = kt,t >0 

(3) g = 0.04 
计算 :q2 。 

15. 某 生 命 个 体现 在 年 龄 为 (下 ) 岁 : (1) 玉 是 整数 未 来 寿命 的 随机 变 


(2) pa;，= 


PJ 


精算 模型 


.28 . 


; (2) gq. = 0.1(k+1),k=0,1,2,.…,9, 计算 Var(K 人 3)。 
16. 生存 函数 SCz) 满足 以 下 条 件 : 


孝 


1 ， O<x<1 
S(x) = Ve 1l1<x<4.5 
0 ， 4 之 4.5 


计算 有 4)。 

17. 一 个 三 减 因 生存 模型 信息 如 下 : (1) h(t) =0.3,:t >0; (2) 7 人 (b) 
=0.5,t >0; (3) 有 (1) =0.7,t >0。 计算 gq。 

18. 一 个 双 减 因 模 型 中 ,， 减 因 1 是 死亡 ,， 减 因 2 是 退 保 ， 具 体 信 息 如 
下 : (1) 联合 单 减 因 模 型 中 死亡 在 每 个 生命 年 中 均匀 分 布 ; (2) 退 保 只 发 
生 在 每 年 年 末 ; (3) 1 = 1000; (4)g2 =0.4; (5) di” = 0.45d2 。 计 
算 p.”。 

19. 一 个 三 减 因 的 生存 模型 中 ,给 出 如 下 信息 : (1) 在 其 相应 的 联合 
单 减 因 模型 中 ,每 一 个 碱 因 在 每 个 整数 年 间 都 服从 均匀 分 布 。 (2) g4 = 
0.200 ; (3) gq = 0.080 ; (4) 9 = 0.125 。 计 算 gq。 

20. 一 个 1 000 人 的 群体 ， 年 龄 均 为 60 岁 ， 服 从 三 个 减 因 : 死亡 ; 残疾 ; 











有 退休。 给 出 如 下 信息 : (1) 独立 表 2-1 

终止 率 如 表 2-1 所 示 ; (2) 在 | 如 4 CB 

多 减 因 神 型 中 各 减 因 在 整数 年 龄 ”0 | 0.010 0. 030 0. 100 
间 服 从 均匀 人 分布。 计算 在 62 岁 a | ooa | oo | ozo 
之 前 退休 人 数 的 期 望 值 。 


沾 
山 
址 
片 
到 


表 





习 肯 标 、 

口 了 解 生 命 表 的 基本 内 容 、 构 造 原理 及 种 类 

口 熟悉 生命 表 函 数 与 生存 分 析 函 数 之 间 的 关系 ， 特 别 是 不 同 假设 下 整 
数 年 龄 间 生 命 表 函数 的 推导 

口 掌握 并 运用 不 同 的 生命 表 解 决 实际 问题 


$3.1 生命 表 及 其 内 容 


3.1.1 生命 表 的 基本 内 容 


在 $2.2 中 我 们 指出 ， 生 命 表 是 给 出 生存 分 析 基 本 函数 在 整数 点 值 的 
表 ， 是 反映 在 封 闲人 口 的 条 件 下 , 一 批 人 从 出 生 后 陆续 死亡 的 全 部 过 程 的 
一 种 统计 表 。 所 谓 封 闭 人 口 ， 是 指 所 观察 的 一 批 人 只 有 死亡 变动 ， 没 有 因 
出 生 而 产生 的 新 增 人 口 和 迁 入 或 迁 出 人 口 。 

人 类 历史 上 最 早出 现 的 生 表 3 -1 生 命 表 


命 表 是 哈雷 茵 星 的 发 现 者 哈雷 L, 








(Halley) 在 1693 年 根据 伦敦 附 0 1 000 000 

近 人 口 死 亡 的 统计 规律 编制 出 : 6"963 

来 的 。 因 为 生命 表 在 寿险 精算 k 3 

中 的 重要 地 位 ， 这 一 年 也 被 称 i 

为 精算 学 的 诞生 之 年 。 
通常 ， 生 命 表 采用 表 3 -1 者 a 

的 形式 编制 。 二 
在 表 3 -1 中 ， 出 现 了 最 基 90 99 580 

本 的 生命 表 函 数 !, ， 它 表示 存 

活 到 年 龄 zx 岁 的 人 口 数 ,zx =0, HH | 0 


1，…，ow-1。 在 存活 人 数 中 ,内 是 上 = 0 时 刻 新 生 儿 的 人 数 ， 称 为 “生命 表 

基数 ”， 由 于 我 们 关心 的 是 一 批 人 在 生命 期 的 死亡 规律 ， 因 此 最 初 人 口 的 绝 

对 数 并 不 重要 ， 研 究 中 可 以 任意 取 值 ， 出 于 方便 通常 取 10 的 整数 次 寡 。w 

是 人 口 生命 极限 年 龄 ， 是 生命 表 的 年 龄 上 限 ， 在 表 3 -1 中 ww = 110。 
为 使 用 方便 ， 生 命 表 中 还 有 其 他 隔 数 ,主要 有 : 


. 29 . 


(1).d.:x 岁 的 人 在 (x, x+nl 死 亡 的 人 数 。 邵 


nd = -Lo (3.1.1) 
简 记 ,az. 为 d, ， 则 
l= >》 d. (3.1.2) 


(2),gq,: x* 岁 的 人 在 (x, x + nj 死亡 的 概率 。 即 
d, 
idz 三 了 (3.1.3) 


简 记 ,g, 为 9.。,4q; 在 第 二 章 2. 3. 1 中 已 经 出 现 过 ， 其 含义 没有 发 生变 化 ,在 
这 一 章 我 们 把 它 用 生命 表 泪 数 表示 出 来 。 在 已 知 9. 后 ， 依 生命 表 基 数 可 
以 计算 出 各 年 龄 的 存活 人 数 和 死亡 人 数 ， 生 命 表 正 是 以 分 析 各 整数 年 龄 死 
亡 概 率 为 基础 编制 出 来 的 。 
与 2. 3. 1 中 的 条 件 概率 相同 ， 我们 有 ,p, = 1 - .9.， 而 且 由 式 (3.1.1) 
和 《3.1.3) 我 们 还 有 
L 





.P: = (3.1.4) 
简 记 ,pz. 为 p. 。 
(3),L.:x 岁 的 人 群 在 (x, x + nj] 生存 的 人 年 数 。 即 
L, = [ a (3. 1.5) 


表示 这 一 时 间 段 内 暴露 于 死亡 风险 下 所 有 生存 个 体 存 活 时 间 的 总 和 ， 也 
称 为 “ 暴 需 数 ”， 是 一 个 表示 人 群 存 活 总 时 间 的 复合 单位 ， 简 记 , 志 .为 过 。 
假设 死亡 时 间 在 整数 年 龄 段 内 均匀 分 布 ， 那 么 (x, x + n] 上 的 死亡 人 


数 ,d, 平均 存活 元 年 ， 活 到 (zx + n) 岁 的 4, 个 人 存活 "年 ， 因 此， 


nb td, = CE tls) (3. 1.6) 
特殊 地 ， 有 
L ~ (+ La) (3.1.7) 


(4) 7. :x 岁 的 人 群 在 未 来 的 累积 生存 人 年 数 。 即 
7 = Dy L = 「 Ldt (3. 1.8) 
(5) e. :x 岁 人 群 的 平均 剩余 寿命 。 这 一 符号 在 第 二 章 的 2.1.3 和 2.3.4 
都 已 出 现 过 ， 但 我 们 在 这 一 章 用 生命 表 函 数 来 表示 它 。 即 


人 
= = | ,pdt (3. 1.9) 


我 们 再 来 考虑 新 生 儿 的 平均 寿命 e。。 假 设 死亡 时 间 在 整数 年 龄 间 均 勾 


了 


o 
e 二 
3 





，30。 


分 布 ， 由 式 (3.1.9) 和 (3.1.7)， 有 


, TT (LL+L+L+-..+L,.) 
A 
全 x L(+) t+ (hth) + + (ls +L)] 
= + x [TDa+ 人 Dat adr + 
= 去 x[ 二 +(1+ 二 ur(2+ 二 和 + + (wm -1+ 二 aa.] 
la 
即 e = 3 [2(: + 二)] 0 


下 面 我 们 来 分 析 式 (3. 1. 10)。 我 们 假设 死亡 时 间 在 整数 年 龄 间 均 匀 分 


布 ， 那 么 :+0.5 是 死亡 者 的 平均 年 龄 。 注 意 到 4 = 邓 d,， 可 以 看 出 ， 新 生 


儿 的 平均 寿命 是 一 个 以 各 年 龄 死亡 人 数 比 例 为 权重 的 平均 死亡 年 龄 。 
运用 生命 表 基 本 函数 ， 我 们 还 可 以 定义 寿险 精算 中 另 一 个 常用 的 死亡 





概率 延期 死亡 概率 。 以 ,, ,9, 表示 x 上 岁 的 人 延期 n 年 在 (x+n,x+ntm] 
岁 之 间 死 亡 的 概率 ， 有 
andsrn 
i (3.1.11) 
L 
Lope bine 
3 1 三 .Ds 6 np 
= ,ps nds (3. 1. 12) 


简 记 .1g。 为 ,19,， 特殊 地 ， 有 ,6g。 =0;,1.g4s = .PD, -9 = Pso 


te de eh i 


a te 


在 初始 时 刻 由 4 个 新 生 儿 组 成 的 封闭 人 群 中 ， 记 其 成 员 的 寿命 分 别 为 
,了 XX， >0,i=1,2,…, 4 假定 这 是 一 组 连续 且 独 立 同 分 布 
的 随机 变量 ， 与 王 同 分 布 。 

在 时 刻 : = x ， 记 这 一 人 群 的 人 数 为 W. ， 有 


N, = $Y I(X, > x) (3. 1. 13) 


大 = 


1 = ELN,] -z[ 三 xx >a] (3. 1. 14) 


> EL[I(X, > x)] = Y P(X, > x) 


l,* .po (3.1.15) 


“31 ， 


。32 。 


:Po = 7 (3.1.16) 


可 饮 ， 在 给 定 生 命 表 基数 4 的 前 提 下 ， 生 命 表 函数 1 ,x 宇 0 和 生存 分 析 
了 消 数 之 间 存 在 一 一 对 应 关系 。 所 以 ， 有 了 生命 表 ， 就 可 以 计算 出 ,p。，x =0， 
1，2，…， 相 应 地 可 以 得 到 .q,，x=0，1，2， 

我 们 在 2.1.1 中 曾 记 新 生 儿 的 生存 顶 数 为 S(x) ， 表 示 新 生 要 儿 的 剩余 
寿命 随机 变量 对 大 于 x% 的 概率 ， 即 S(x) =.po, 因此 通过 生命 表 中 的 1. 就 可 
以 完全 掌握 S(x) 在 各 整数 点 的 值 。 但 这 是 不 够 的 ， 我 们 还 需要 其 他 生存 分 
析 的 函数 来 确定 相 邻 整数 年 间 的 生存 人 数 。 

1. 死亡 力 。 在 2.1.3 中 ， 我 们 提 到 把 新 生 儿 的 风险 率 函 数 称 为 “死亡 








力 "， 用 六 表示 ， 即 几 = - A 
由 于 1 = 4 S(x) ， 所 以 ， 
dl dlnl 
p (3. 1. 17) 
类 似 于 式 (2.1.8) 的 推导 ， 我 们 有 
1 = le he (3.1.18) 


2. 天 的 概率 密度 。 由 式 (2.1.5) 可 知 f(x) = h(x)S(x) ， 因 此 我 
们 有 
f(x) = S(x) “1 = -po HA (3.1.19) 


另外 ， 由 式 (2.1.15), 有 人 2 = S(x) -py。， 即 





d,po 
= ,po HK, (3. 1. 20) 
dx 
3. 革 的 方差 ,XX 的 二 阶 矩 为 : 
E(X) = [* "f(x)dx = 三 = “Pu * Ldx (3.1.21) 


对 式 〈3. 1.21) 分 部 积分 得 : 


2| x* ldx 
E(X’) = 2| x podx = (3. 1. 22) 
o l, 
再 由 式 (3. 1.8) 得 : 
0 (3. 1.23) 
dx J 


利用 式 (3.1.23) 对 式 (3.1.22) 的 分 子 分 部 积分 ， 有 E(X) 
2 .dx 


L 


0 


伶 





站 
y, = 上 7 dx (3.1. 24) 

则 E(X’) = (3. 1.25) 

因此 ， Ver(X) - 了 (到 (3. 1. 26) 


4. x 岁 人 剩余 寿命 的 概率 密度 。 在 第 二 章 中 ,我们 定义 了 个 体 生存 时 
间 为 7。 在 生命 表 中 ， 若 个 体 在 初始 时 刻 的 年 龄 为 x ,我 们 记 其 剩余 寿命 
为 T(x) ， 仍 简 记 为 7T， 则 有 T= XX-x。 由 式 (2.3.7) 有 


ft X25) fs ttl > = (3. 1. 27) 





i, l 
由 式 (3.1.19) 得 f(x+t) = Ar ee ， 又 由 S(x) = 了 ， 从 而 ， 


fr(i|xX > x) = 2 = ,Pp “Hs (3. 1.28) 
又 因为 ,p, = P(T>z| 和 >x) =1-P(TSiE|X>x) =1-F(t| 久 >x)， 所 以 ， 

9 -9 a 

Dp,) =— LP]X > #)] = -f(t|X > x) 


= -Pp pen (3.1.29) 
相对 随机 变量 ,车 把 个 体 在 初始 时 刻 的 年 龄 x 当 作 常量 ， 则 
(3. 1. 29) 也 可 记 为 : 


Hi Pe) = Pe Kew (3. 1. 30) 


用 式 (3. 1. 30) ， 我 们 还 可 以 得 到 x 岁 人 平均 剩余 寿命 e. 的 又 一 个 表达 式 : 


e. = E(T) = | tf(t|X > x)dt = 全 -, p, Wdt 
三 dt (3. 1.31) 
了 
= (3. 1. 32) 
2Y. 
以 及 E(T) A (3. 1.33) 
2Y., ya 
和 Var( 7T) (3. 1.34) 
其 中 ， ,= 三 Tdy (3. 1. 35) 


5. 中 心 死亡 率 。 在 人 口 学 中 ， 还 有 一 个 更 常用 的 死亡 率 概 念 ， 即 在 
2. 3. 5 中 定义 的 中 心 死亡 率 ,m,。 由 式 (2.3.21) 可 知 : 


33. 


94 


”S(x +i) 


[SC + h(x + td | OL tat 
Mm, = 2 和 LA 
| SC + t)dit | ta 


| “udt lx [ Ps * Kundt 
_ -20 0 


| “pdt 1 x | dt 
0 0 





Lx | fllx > 2) 地 A 








lL x | pd 1 x ,pudi 
_lxP(T<n|X > wx) 
二 Ludi 
nd 
(3. 1. 36) 


这 说 明 ， 中 心 死 亡 率 ,m, 还 可 以 看 成 是 与 死亡 率 .9. 类 似 的 一 种 死亡 率 ， 只 
不 过 与 .9 = 字 相 比 ， 其 分 母 产生 了 变化 。 下 面 我 们 来 考查 二 者 之 间 的 
关系 。 

由 于 = da = /pd 


让 


4[z pi -|{ -5p- pen) dt] 
0 
= mL， | 1 1 dt (3. 1. 37) 
0 


所 以 ,feb pdt = -nl,,, (3. 1. 38) 
0 


式 (3. 1.38) 具有 明确 的 含义 ,表示 在 区 间 (x, x-+ n] 上 死亡 的 人 在 
这 段 时 间 内 生存 的 总 年 数 ， 在 此 基础 上 ， 我 们 定义 

六 二 一 nl,,, (3. 1. 39) 

“ n.d 

则 ,了 表示 在 这 段 区 间 上 死亡 的 人 在 单位 区 间 上 生存 的 平均 年 数 ， 这样， 我 


们 有 


4 


ss = nl 十 六 (3. 1.40) 
再 把 1,,=/L -.d. 代 入 式 (3.1.40)， 可 得 : 
,= nl 一 有 1L 一 大 )。d. (3. 1. 41) 
把 式 (3. 1.41) 代入 式 (3. 1.36) ， 就 可 找 出 ,m, 与 ,q, 之 间 的 关系 : 
2。 


(3. 1.42) 


m 二 


”nn-n(l -,/£).g. 





.4 = -一 (3. 1. 43) 


在 由 人 口 统计 数据 编制 生命 表 时 ， 由 于 资料 限制 ， 中 心 死 亡 率 更 容易 
得 到 ， 因 此 式 (3. 1.43) 在 计算 死亡 率 时 非常 重要 。 
特殊 地 ， 当 n= 1 时 ， 有 


入 g, 
et ee (3.1.44) 
gq; ee (3. 1.45) 


如 果 再 假设 死亡 时 间 在 整数 区 间 内 均 勾 分布， 那么 f. =1/2 (这 个 结果 见 例 
3-3)， 式 〈3.1.45) 进一步 简化 为 : 


2m, 





gq. (3. 1. 46) 


2+m, 

式 (3.1.46) 也 是 编制 生命 表 时 常用 的 一 个 重要 公式 。 
【 例 3-1】 已 知 4=100000, Z =97 408, /,=97 015, L, =97764,,L 

=388 713。 求 有 和,/。 
解 : d, =4 -1 =2592， 由 式 (3.1.39) 可 知 

f _b- 4h _ 97 764 - 97 408 

9 d, 2 592 
类 似 地 , yd) =4 -7 =393， 仍 由 式 (3.1.39) 可 知 : 


Li -4ls 388713 -4 x97 015 
= = 0.415394 
1 4 x 393 要 


【 例 3-2】 已 知 ,qso。 =0.4， ;mso =0.102。 求 , fio。 
解 : 由 式 (3.1.43) 可 解 得 : 
3 Xx smso — sqso 


-fi = =0. 539216 
sf 5 X smMsgo Xsqso 





= 0. 137346 














所 以 ,, As =0.460784。 到 


83.2 . 作 信 时 数 年 耸 间 的 死 工分 布 


生命 表 是 以 整数 年 龄 分 组 编制 的 。 在 保险 精算 实践 中 ， 常 常 需 要 相 邻 
整数 年 间 生 存 或 死亡 的 信息 ， 如 30 岁 的 人 存活 半年 的 概率 ,,, p;),。，50.5 岁 的 
人 4 个 月 内 死亡 的 概率 ,,qsos，40 岁 的 人 在 40. 25 岁 的 条 件 概 率 密 度 以 及 任 
意 一 个 年 龄 段 的 中 心 死亡 率 ， 等 等 。 获 得 这 些 信息 除了 利用 生命 表 ， 还 需 
要 对 相 邻 整数 年 龄 间 的 生存 函数 作出 假设 。 

常用 的 几 个 假设 是 死亡 时 间 均 匀 分 布 假设 、 死 亡 力 恒定 假设 和 Balduc- 
ci 假设， 这 三 种 假设 分 别 对 应 线性 插值 法 、 指 数 插值 法 和 调和 插值 法 。 


a 


在 3.1.2 考 虑 互 岁 人 剩余 寿命 的 概率 密度 时 ， 我 们 曾 把 初始 年 龄 为 x 
的 人 的 剩余 寿命 记 为 T(x) ， 简 记 为 7T。 在 这 一 节 ， 我 们 仍然 沿用 上 述 的 简 
便 记 法 ， 把 个 体 的 生存 时 间 记 为 7， 在 不 致 混淆 的 情况 下 ， 把 相 邻 的 整数 
年 龄 区 间 记 为 (x, x +1)。 


te le ids 


假设 死亡 时 间 了 在 区 间 (x, x+1] 内 均匀 分 布 ， 此 时 生存 函数 是 线性 函 
数 ， 对 任意 的 0 < 上 <1， 有 








S(x+i1) = (1 -1):. SGxz) + S(x+1) (3.2.1) 
S(x) - S(x +1) S(x) —-[(1 -it): S(x) +t S(x+1)] 
于 是 ， :4: = SCx) = SCx) 
- = 1g, (3. 2.2) 
‘PpP: = 1-.g.=1-ig, (3.2.3) 
ids 二 ,9g。 74 = tgs, 0<s+tisl (3.2.4) 


式 (3.2.4) 说 明 , 个 体 在 区 间 (x, x +1] 上 任何 一 个 长 度 为 上 的 期 
间 死 亡 的 概率 都 相同 ， 这 也 是 死亡 均匀 分 布 的 一 个 体现 。 
由 式 (3.2.4)， 有 


t 
qe 2 =- Oss<l 


Pp: 1 一 sg。 
dS(x + 1)/di d[(1-:1):S(x) +t: S(x+1)1/dt 


0O<s+i<l (3.2.5) 





> 

















另外 ， fr(2) RD Sx) 
S(x) — S(x+1) 村 
= Be 过 (3.2.6) 
又 因为 f(t) =,p, AH， 所 以 ， 
Wes 人 (3.2.7) 
Pp: 1 -ig, 
久 ,: 随 着 时 间 递 增 。 
【 例 3 一 3】 在 死亡 时 间 均 匀 分 布 假设 下 ,估计 式 (3.1.39) 定义 
的 了 上 。 
1 
i ,+—d 一 ! 
L.-l,i +1 2 > +1 _ 1 
解 : /= d d. 六 枯 


这 种 情 次 下 ， 假 设 生 存 函 数 的 规律 如 下 : 
lInS(x +t) = (1 -i) .lnS(x) +ti lnsGxz+1)，0<i<1 


(3.2.8) 


。 36 . 























D> 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
民 S(x +1) =Sxz) 一 .SGzt+t1l) ,0<t< 1 (3.2.9) 
那么 有 
_ SC(x+t) SG SC(x+1)’ [FSCx+1)1 : 
‘Ps S(x) S(x) | SCx) 人 
Bh ‘Ps = (ps) (3.2. 10) 
所 以 ， :qd = 1 —,p, =1—-(p,) (3.2.11) 
而 且 有 
S(x +s) _S(x+s+t) 
S(x+s)— S(x+s+:) S(x) S(x) 
S(x+s) S(x+s) 
S(x) 
(Pp:) - (ps) ; 
一 = 1 
9 
即 ‘qn = 1 — (p,)', 0O<s<1, 0<s+t<l (3. 2. 12) 
还 有 
_ dS(x+it)/dt _ 
pr BC =— d[lnS(x +1) 1/dt 
=—ad[(l -i) .lnS(x) tt:lnS(x+1)]/d 
a S(x+t+1) 
ln SCx) = 一 lnp, 
即 Ki = — lnp, (3.2.13) 


式 (3.2.13) 说 明 , 个 体 在 区 间 (x,x+1] 上 的 死亡 力 是 常数 ， 所 以 这 


种 情形 称 为 死亡 力 恒定 假设 。 由 于 这 个 常数 只 与 年 龄 x 有关， 因此 不 妨 记 


做 


? Bh 人 。 = — lnp, o 


另外 ， fi(2) =,ps ps = ~ (lnp,) (p.) (3.2.14) 
在 这 一 假设 下 ， 可 以 得 到 如 下 一 些 结果 : 


我 们 知道 ， 中 心 死 亡 率 是 死亡 力 的 加 权 平 均值 ， 如 果 死 亡 力 是 常数 ， 





那么 中 心 死 亡 率 也 是 常数 ， 这 一 结论 也 可 通过 如 下 的 推导 得 到 验证 : 
d, d, d, d, 1 
= = 一 二 = =— lnp, = 人 。 
人 Ldt 上 (Cp, ) ‘de dt 四 np ) 
妈 m, = Lk, (3.2.15) 
由 式 (3.2.15) 可 得 : 
d d 
7 (3.2.16) 
m, hk 
因此 ， dd a (3.2.17) 
L, L, b Ed l y=z Ky, 


【 例 3 -4】 在 死亡 力 恒定 假设 下 ,用 p, 表示 式 (3.1.39) 定义 的 广 。 
解 : 由 式 (3.2.16) 和 (3.1.39) 可 得 : 
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ded ed it i et er de Ts A i es Dele es -3 
d 1 
L. — Lu — lnp, 1 Ln 1 Pp: 
= d d np d, | lnp 1~-p 四 


0 


这 种 情 次 下， 假设 生存 函数 的 规律 如 下 : 
1 1 二 了 t 
S(x +i1) S(x) S(x+t+1) 


由 式 (3. 2. 18) 可 得 : 








,OO <1t<l (3.2.18) 


“<T 


SC Ey [sey + (ser - sc)] (3. 2. 19) 











1 S(x) e 1 1 1 
|| 
Ep + (二 1) (3. 2. 20) 
p: 
ml 1—g, 
则 We (3. 2.21) 
tg, 
1:9: 二 Tl -2g (3: 2 22) 
: _ Pp: + sg, 
而 且 有 Uh <s<s1,0<s+t+t<l1 (3. 2. 23) 
二 mu 5 5 
a sl1,0<s+tit<l1 (3.2. 24) 
其 中 ,， 式 (3.2.22) 的 推导 留 做 练习 。 
d /d 
A 
4 a (3. 2. 25) 





Mr 1- (lt)g, p,+ig, 
式 (3.2.25) 说 明 ,,, 随 着 时 间 递 减 。 事 实 上 ， 在 非 整 数 年 龄 内 死亡 
力 递减 的 情况 下 ， 式 (3.2.25) 对 于 估计 死亡 概率 非常 重要 。 
另外 ， 还 有 


Ee 
fri(t) =, Pp * Ks = 六 (3.2. 26) 


特殊 地 ， 当 上 =1-s 时 ， 有 
.gs = (1-s)9q.，0 友 ss 三 1 (3. 2. 27) 
意大利 精算 学 家 Gaetano Balducci 在 他 的 许多 论文 中 使 用 这 一 假设 ， 因 
此 称 这 一 假设 为 “Balducci 假设 ”。 
【 例 3-S5】 假设 相 邻 整数 年 龄 间 的 死亡 服从 Balducci 分 布 , 求 e. 。 
解 : 由 式 (3.2.27) ， 在 Balducci 假设 下 ， 有 ,_,p,,, =p, +sg,, 0s 万 1。 














第 三 章 生命 表 
-号 - ER 
那么 ， 
1 7 
2 = [Lds = 4 a 
0 0 +1 
1 1 ! 1 Ls lnp 
=1 ds =1 — ds = 
"| a | prtsg, g; 
i 大 1 < 1 忆 bulnp, yau Ps © lnp, 
人 人 = 
【 例 3-6】 在 某 生命 表 中 ， 7, =1 000, 4.,, =900, 分 别 在 死亡 时 间 均 


匀 分 布 假设 、 死 亡 力 恒 定 假设 、Balducei 假设 下 估计 m,。 





解 : 由 已 知 d, =100, lnp, = -0. 10536。 
。 | d 
在 死亡 时 间 均 匀 分 布 假设 下 : [= 4 一 序 d. =950,， 则 m= 
=0. 10526 ; 
在 死亡 力 恒 定 假 设 下 : m,=j, = -lnp. =0. 10536 ; 
llnp, 
在 Balducci 假设 下 : L = -二 一 一 =948.24， 因 此 mm. =0. 10546。 外 


zx 


表 3 -2 是 对 上 述 三 种 假设 下 估计 结果 的 总 结 。 


表 3 -2 





线性 
(死亡 时 间 均 匀 分 布 假设 ) 





欧 数 


不 同 假设 下 的 生命 表 函 数 及 其 关系 式 


指数 
(死亡 力 人 恒定 假设 ) 












S(x +1) 
= (1 -it)S(x) +tS(x +1) 


S(x +1) 





调和 
(Balducci 假设 ) 





S(x +i) 


= [S(x)]'™. (SC(x+1)]’ 





































































1 - (p.)!’ 
ps: 
:Ps 1 - tq. (p-) 
Ps: + tg 
tq tq 
1 i £ 
1 -sg (ps) p: + (t+s)g 
(1 ~ it)g, 
1 - (ps.)'™ (1 -2)9, 
— tq, 
9- qs 
Hrre lnp, 
1 一 tq, Ps + tq 
psq: 
万 (但 gx (— lnp.) : (ps.)’ ee 
(ps + 19。) 
ad, Ll 
L, L = i +l np- 
2 lnp。 qs 
qx 2 
m, 1 - lnp。 _ (9) 
1 -一 9 一 ps“，lnp。 
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$3.3 选择 一 终极 生命 表 


3 人 从 守信 认 的 和 并 


生命 表 有 很 多 种 类 ， 其 用 途 各 不 相同 。 国 民生 命 表 根据 全 体 国民 的 死 
亡 数据 编制 而 成 ， 可 以 概括 描述 国民 总 体 的 寿命 状况 ; 经验 生命 表 由 人 寿 
保险 公司 根据 投保 人 的 死亡 记录 编制 ， 通 常 由 寿险 公司 专用 。 

经 验 生命 表 按 照 经 验 统计 资料 性 质 的 不 同 ， 可 以 分 为 选择 生命 表 、 终 
极 生命 表 和 综合 生命 表 。 

1. 选择 生命 表 。 成 为 寿险 保单 的 被 保险 人 通常 要 经 过 体检 ， 他 们 的 死 
亡 率 在 最 初 几 年 内 较 一 般 水 平 低 ， 这 最 初 的 几 年 被 保险 公司 定 为 选择 期 。 
仅 根据 处 于 选择 期 的 被 保险 人 死亡 数据 编制 的 生命 表 称 为 “选择 生命 表 ”。 
选择 生命 表 可 以 显示 保险 公司 通过 体检 等 手段 选择 被 保险 人 的 效力 ， 一 般 
来 说 ， 被 保险 人 的 投保 年 龄 和 投保 时 间 成 为 影响 死亡 率 的 最 主要 因素 ， 除 
此 之 外 ， 性别、 是 否 吸 烟 等 因素 也 会 明显 影响 死亡 率 。 

在 选择 生命 表 中 也 可 以 列 出 各 年 龄 的 生存 人 数 li, ， 也 有 与 综合 生命 表 
中 类 似 的 关系 式 。 如 

inet Sie So dies 
de Ds 


g Pe p Ej 
1 a Pi 
Ls Lyen 
Ts ZU :sm Ls rntmil 
ml Gd [Es]+n ee I 
{z]+n 


2. 终极 生命 表 。 根 据 已 经 流 过 选择 期 的 被 保险 人 的 死亡 数据 编制 的 生 
命 表 称 为 “终极 生命 表 ”。 

3. 综合 生命 表 。 不 考虑 选择 期 ， 由 全 体 被 保险 人 的 死亡 数据 编制 的 生 
命 表 称 为 “综合 生命 表 ”。 


.3.2 选择 一 终极 生命 表 


tr nso, 


由 于 保险 公司 核 保 的 选择 ， 一 组 被 保险 人 的 死亡 率 不 仅 随 投保 年 龄 变 
动 ， 而 且 随 投保 时 间 变 动 。 以 qi,,, 表示 % 岁 投保 、 经 过 nn 年 后 在 (x +zm) 岁 
死亡 的 概率 ， 有 
qi < gin < ga < (3.3.1) 
通常 选择 效力 会 随时 间 增 加 逐渐 消失 ， 即 投保 时 间 n 越 长 ，g1,_,j ,4 与 
dt: 越 趋 于 相等 ， 选 择期 最 长 也 不 会 超过 15 年 ,我们 把 选择 期 记 为 
r 年 。 
对 于 任何 一 个 特定 年 龄 的 被 保险 人 来 说 ， 如 果 保 险 期 间 开 始 时 他 的 年 


龄 为 整数 x， 那 么 在 接 下 来 的 每 一 个 整数 年 内 ， 他 的 死亡 率 为 gu,， =0， 
1, 2, 的 一 般 地 ， 有 


Giz]+ta < as (ee 0 ， 1 ， 2 机 三 一] (3. 3.2) 
过 了 7 年 的 选择 期 ， 选 择 的 效力 消失 ， 即 
Glsl+ta = drtns nN 三 TT, TT Le (3. 3.3) 


根据 gt， n=0,1,， 2，…,r-1 编制 的 生命 表 就 是 选择 生命 表 ， 由 
选择 效力 消失 后 的 死亡 率 编制 的 生命 表 就 是 终极 生命 表 ， 习惯 上 将 终极 表 
并 列 在 选择 表 的 右边 ， 这 样 的 生命 表 就 是 选择 一 终极 生命 表 ， 如 表 3 -3， 
为 简明 起 见 ， 这 里 假定 选择 期 为 5 年 。 




















表 3-3 选择 一 终极 生命 表 例 表 
选择 表 终极 表 
[zx] 
qt{z! Grz]+l [zx}+2 Grz]+3 Glz]+4 | 9[z]+5 x%+5 

[70 ] 0.0175 0. 0249 0.0313 0. 0388 0. 0474 0. 0545 75 
[71 ”0.0191 0. 0272 0. 0342 0. 0424 0.0518 0. 0596 76 
[72 1 0. 0209 0. 0297 0. 0374 0.0463 0.0566 0.0652 77 
[73] 0. 0228 0. 0324 0. 0409 0. 0507 0. 0620 0.0714 78 
[74} 0. 0249 0.0354 0.0447 0. 0554 0. 0678 0. 0781 79 
[75 ] 0. 0273 0.0387 0.0489 0. 0607 0. 0742 0. 0855 80 
[76] 0.0298 0. 0424 0. 0535 0. 0664 0. 0812 0. 0936 8l1 
£77] 0. 0326 0. 0464 0.0586 0.0727 0. 0889 0. 1024 82 
[78 ] 0. 0357 0. 0508 0.064[ 0.0796 0. 0973 0. 1121 83 
[79] 0. 0391 0.0556 0.0702 0. 0871 0.01065 0. 1227 84 

















在 表 3 -3 中 , gp = 0.0463 ， 表示 投保 年 龄 为 72 岁 的 被 保险 人 投保 
3 年 后 的 死亡 率 是 0.0374， 但 是 ， 过 了 选择 期 后 ， 投 保 年 龄 为 72、73、74 


和 75 岁 的 人 在 80 岁 的 死亡 率 都 是 0. 0855。 
从 选择 表 的 左下 至 右上 可 表 3 -4 选择 生命 表 全 志 














以 引出 一 些 对 角 线 ， 同 一 条 线 tar | lat 

上 的 数据 表示 在 不 同年 龄 投保 35 994 985 | 39 

但 处 在 同一 到 达 年 龄 的 被 保险 3 2 2 

人 的 死亡 率 ， 以 表 3 -3 中 划 线 了 i 30 多 

数据 为 例 ， 在 到 达 年 龄 为 74 岁 3 we 9 | | 44 

这 条 线 上 可 以 查 到 如 下 的 死 ” oo 
2 





亡 率 : qt7] = 0. 0249 ， 0a]el 
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=0.0324, gi =0.0374，gb, =0.0424, gs =0.0474。 


【 例 3 -7】 根据 如 表 3 -4 所 示 的 选择 生命 表 ， 计 算 , pw,、; pin)、 


29f37]+2、 2 | G036lo 


) l, ”985 
解 : ,p ,=-954 = 一 ”= 一 = =0.986974 
3 二 [35j +1 lssyr Lo 998 


Lr3s1 13 Lg] 13 _975 











= = =0.98286 
Po 1 lo 992 3 
Ls] +2 一 La :4 Ls] :2 -Lb 987 -977 
= 一 三 = = 0. 010132 
2 ee Tn 987 
Lo 一 Lao, 990 -987 
0 003012 各 
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【 例 3-8】 在 选择 期 为 1 年 的 某 生 命 表 中 ， 下 列 关系 对 于 所 有 年 龄 都 


成 立 : 0.5q[:] =0. 33g,, 0.sqriro.s =0. 539.， 试用 p, 表示 Pa。 


解 : 
P = (spl)(ospios) = (1 -os 911) (1 -os gos) 
= (1 -0.339.)(1 -0.59q.) = [1 ~0.33(1 -p.)jJ[1 -0.5(1 —p,)] 
= (0.67 +0.33p.)(0.5 +0.5p,) = 0.335 +0.5 p, +0.165p’ 
看 
题 


1. 菜 生命 表 生 存 概 率 p, 的 值 如 表 3 -5 所 示 。 


表 3-5 








0.0 





(1) 计算 对 应 于 x=0,1, 2,，3,4,5 的 S(x) 的 值 ; 

(2) 以 10 000 为 基数 ， 推 导出 表示 d, 和 1 值 的 生命 表 ; 

(3) 该 表 中 的 中 是 多 少 ? 

2. 由 上 题 中 的 生命 表 计 算 下 列 各 值 : (1) :di (2);9,; (3); pi; (4);9:。 
3. 已 知 新 生 儿 在 % 岁 与 (x+1) 岁 之 间 死 亡 的 无 条 件 概率 为 .gu,， 要 求 : 
(1) 分 别 用 SGxz) 与 1 定义 .9oj 


(2) 证 明 》 “|g = 1。 


4. 某 生 命 表 由 生存 函数 S(s) = 一 


,0 < 反 x 委 c 构 造 ， 令 1 =100 000， 
EB 


且 已 知 /1; =44 000。(1) 求 这 个 生命 表 中 的 w; (2) 求 新 生 儿 活 到 60 岁 的 


.42 ， 


概率 ; (3) 求 10 岁 的 人 在 30 岁 与 45 岁 之 间 死 亡 的 概率 。 
2 到 2 

和 十 1 100 -x” 

命 表 中 1~4 岁 之 间 的 死亡 人 数 。 


6. 来 0 





5. 如 果 作 = 0 三 x < 100 。 求 上 =10 000 时 ， 在 该 生 


7. 如果/ =2500 x(64 - 0. 5 三 x 三 80 ， 求 umn 的 值 。 

8. 证 明 :e, =p,(1 +e.n)。 

9. 给 定 某 一 生命 表 中 的 下 列 数据 : ls = 80 000, 4 =42 693，4,, = 
40 280, 1 = 37 480， 在 下 列 假设 下 求 一 个 50 岁 人 未 来 寿命 的 中 位 数 : 
(1) 死亡 时 间 均 匀 分 布 ; (2) 死亡 力 恒定 。 

10. 对 于 选择 年 龄 为 0 岁 的 3 年 选择 期 的 选择 一 终极 表 ， 在 下 列 条 件 下 


9 


4 
一 一 ， ad, = 5 000(x 三 3)， 3 Prolrl 一 10° 


1 
求 li: ls = 90000,qm = 二 ,5pnl = 5 


3Pn]o 

11. 已 知 1 =98 617,， 4 =97 952。 在 以 下 两 个 假设 下 计算 ,gqy: 

(1) 在 30~40 岁 之 间 死 亡 时 间 均 匀 分 布 ; 

(2) 在 30 ~40 岁 之 间 死 亡 力 恒定 。 

(3) 分 别 在 (1)、(2) 两 个 假设 下 计算 10 万 个 新 生 儿 中 活 到 35 岁 的 
人 人数。 . 

12. 假设 整数 年 yx 和 7y+1l 之 间 的 死亡 力 几 是 恒定 的 ， 令 也 是 xx 岁 以 后 
的 生存 年 , 3.(5) 是 了 .的 生存 函数 。 证 明 :H = In[S,(y-x)] -ln[S,(y+ 
1 -x)]。 

13. 已 知 一 组 动物 的 死亡 率 为 q, =0.1, 分 别 在 三 种 假设 下 计算 m,; 
(1) 死亡 时 间 均 匀 分 布 假设 ; (2) 死亡 力 恒定 假设 ; (3) Balducci 假设 。 


14. 已 知 1,=1 000(1 i 计算 下 面 各 项 的 值 : 

(C1) lo, lz, dss, 30920, 20 Pao; 

(2) 25 岁 的 人 至 少 存 活 20 年 ， 最 多 存活 25 年 的 概率 ; 

(3) 3 个 25 岁 的 人 均 存 活 到 80 岁 的 概率 。 

15. 已 知 qg. =0.095, ,9,,1 =0.171，9g,,3 =0.2， 计 算 9 + gq,,20 

16. 已 知 15 =100，j1u =80。 试 分 别 在 死亡 时 间 均 镁 分布、 死亡 力 恒定 
和 Balducci 假设 下 计算 ls。 

17. 表 3 -6 是 一 个 选择 期 为 一 年 的 生命 表 。 假 设 每 一 年 死亡 均匀 分 布 ， 
计算 el。 
0.05， 5 
0.04，6 


0<x<60 . 
0 3 计算 ;i144soo 


18. 已 知 : (x) = | 
x < 70 


.43 。 


19. 某 两 年 期 的 疾病 治 池 项 
目 信 息 如 下 ; (1) 只 有 10% 的 
人 .生存 至 第 二 年 年 底 ; (2) 每 个 
整数 年 的 死亡 力 恒定 ; (3) 第 二 
年 的 死亡 力 是 第 一 年 的 3 倍 。 计 
算 一 个 在 第 三 个 月 末 还 存活 的 项 
目 参 加 者 在 第 21 个 月 末 死 亡 的 概率 。 











20. 证 明 : L,,， = 上- 2 
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第 四 章 理赔 额 和 理赔 次 数 的 分 布 


口 了 解 以 下 概念 : 理赔 额 、 损 失 额 、 免 赔 额 、 保 单 限 额 和 比例 赔偿 
口 了 解 不 同 的 赔偿 方式 对 理赔 额 和 理赔 次 数 造 成 的 影响 

口 熟悉 常见 的 损失 额 分 布 以 及 不 同 赔 偿 方 式 下 理赔 额 的 分 布 

口 熟悉 单个 保单 理赔 次 数 的 分 布 以 及 (a,b,0) 分 布 类 和 (a,b,1) 分 
布 类 

口 熟悉 不 同 结 构 浮 数 下 保单 组 合理 赔 次 数 的 分 布 以 及 相关 性 保单 组 合 
理赔 次 数 的 分 布 

口 掌握 并 运用 各 种 条 件 下 理赔 额 与 理赔 次 数 的 分 布 解决 实际 问题 





$4.1 损失 额 分 布 


4 

在 非 寿险 业务 的 经 营 中 ， 保 单产 生理 赔 额 大 致 包括 两 个 步骤 : (1) 保 
险 事故 发 生 ， 造 成 财产 损失 或 人 身 伤亡 ; (2) 被 保险 人 提出 索赔 ， 保 险 公 
司 进行 理赔 。 但 是 ， 并 不 是 所 有 的 保险 事故 必然 引起 索赔 ， 而 且 保 险 公 司 
的 理赔 额 也 并 不 总 是 等 于 实际 的 损失 额 。 

损失 额 和 理赔 额 是 两 个 不 同 但 又 密切 相关 的 概念 ， 损 失 额 是 指 承 保 标 
的 发 生 实 际 损失 金额 的 大 小 ， 而 理赔 额 是 指 保险 公司 按照 保单 条 款 所 实际 
支付 的 金额 ， 也 可 称 为 “赔付 额 *5。 理 赔 额 通常 小 于 实际 损失 额 。 一 般 来 
说 ， 理 赔 分 为 两 类 : 完全 理赔 和 部 分 理赔 。 在 完全 理赔 中 ， 理 赔 额 就 是 保 
险 事故 的 实际 损失 额 ; 在 部 分 理赔 中 ， 理 赔 额 可 能 会 低 于 实际 损失 额 。 部 
分 理赔 涉及 的 基本 概念 如 下 : 

1. 免 赔 额 (Deductible)。 是 指 保单 规定 的 最 低 起 赔 额 ， 当 损失 额 低 于 
这 一 额度 时 ， 保险 公司 不 赔偿 ,保险 公司 只 赔偿 高 出 的 部 分 。 

2. 保单 限额 (Policy Limit)。 是 指 保单 约定 的 最 高 赔偿 金额 。 当 损失 人 金 
额 超过 保单 限额 时 ， 被 保险 人 将 只 获得 最 高 赔偿 额 ， 超 出 部 分 由 被 保险 人 
承担 。 

保险 公司 设置 免 赔 额 和 保单 限额 的 目的 ， 是 建立 一 种 与 被 保险 人 共 担 
风险 的 机 制 ， 从 而 有 效 控制 保险 赔款 支出 。 除 此 之 外 ， 免 赔 额 还 可 以 提高 
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被 保险 人 的 安全 意识 ,减少 理赔 次 数 并 降低 保险 经 营 的 费用 。 

如 果 保 单 同时 规定 了 免 赔 额 4 和 保单 限额 D， 则 被 保险 人 实际 所 能 得 
到 的 最 高 赔偿 金额 为 D -4d。 

3. 比例 赔付 。 是 指 在 保单 中 约定 一 个 比例 常数 k,0 < k < 1 ， 当 保险 
事故 的 实际 损失 额 为 Xx 时, 保险 公司 支付 赔偿 金 区 ， 剩余 的 损失 额 
(1 -月 )XX 由 被 保险 人 自己 承担 。 当 保单 中 同时 设 有 人 免 赔 额 4、 保 单 限额 D 
和 赔付 比例 时， 被 保险 人 最 终 得 到 的 理赔 额 最 高 为 k(D - 4d) 。 

对 保险 公司 来 说 ， 理 赔 额 比 损失 额 更 值得 关心 ， 因 为 费 率 厘定 、 准 备 
金 计 提 及 再 保险 安排 等 精算 问题 都 以 理赔 额 的 分 布 为 依据 。 但 是 ， 理 赔 额 
是 在 损失 人 额 的 基础 上 定义 的 ， 只 有 对 损失 人 额 分 布 有 充分 的 了 解 ， 才 能 获得 
理赔 额 的 分 布 。 因 此 ,我 们 有 必要 先 研究 损失 额 的 分 布 ， 再 研究 理赔 额 的 
分 布 。 


4.1.2 常见 的 损失 额 分 布 
由 于 损失 额 和 理赔 额 的 不 确定 性 ， 因 此 常用 随机 变量 来 描述 它们 ， 如 
果 再 考虑 时 间 因 素 ， 就 可 以 用 随机 过 程 来 衡量 。 对 于 一 个 随机 变量 来 说 ， 
把 握 其 特征 规律 最 重要 的 就 是 它 的 分 布 。 除 了 分 布 之 外 ， 了解 其 数字 特征 
或 各 阶 矩 ， 对 于 把 握 随 机 变量 的 特征 也 有 重要 意义 。 
我 们 首先 考虑 单个 保单 或 个 体 保单 损失 额 的 分 布 。 从 直观 上 讲 ， 单 个 
保单 的 损失 额 应 该 具有 下 面 的 分 布 特征 : 
(1) 损失 额 是 非 负 的 ， 因 
此 P(X 二 0) =1; f0) 
(2) 损失 额 应 该 是 连续 变 
化 的 ， 因 此 f(x) 是 连续 的 ; 
(3) 损失 额 较 小 的 保险 事 
故 发 生 的 可 能 性 较 大 ， 而 损失 
额 较 大 的 保险 事故 发 生 的 可 能 
性 较 小 ， 但 不 可 以 和 忽略。 直观 
看 来 ， 损 失 额 概率 密度 函数 的 
尾部 较 厚 ， 如 图 4 -1 所 示 。 
满足 上 述 性 质 的 随机 变量 Q 


很 多 ,常见 的 分 布 有 指数 分 布 、 图 4 -1 单个 保单 损失 额 的 概率 密度 
伽 玛 分 布 、 对 数 正 态 分 布 、 帕 累 托 分 布 和 韦伯 分 布 ， 我 们 下 面 会 对 这 些 分 
布 作 简单 介绍 。 


在 介绍 分 布 之 前 ， 由 于 答 母 函数 对 于 求解 随机 变量 各 阶 和 矩 的 重要 性 ， 
我 们 首先 介绍 矩 母 函数 。 
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定义 4-1 随机 变量 藉 的 分 布 珊 数 为 F(x*)，, 其 矩 母 责 数 为 : 


Mr(D = Ele®) = | edF(x),t>0 


一 上 


由 定义 4-1 可 以 看 出 ， 矩 母 画 数 在 原点 总 是 有 定义 的 ， 且 Mi(0) =1。 
如 果 世 的 矩 母 函数 在 原点 的 某 邻 域 |1| < r(r > 0) 内 存在 ， 则 在 此 邻 域内 ， 
Mi(1) 具有 如 下 性 质 : 

性 质 1 在 |:| <r 内 ,天 的 分 布 函数 由 矩 母 函数 My(i) 唯一 确定 ; 
比如 有 两 个 分 布 函数 F(x) 和 忆 (z), 若 它们 对 应 的 矩 母 画 数 相 同 ， 则 有 
F(x) = F,(x)。 

性 质 2 记 半 的 k(k = 1,2,…) 阶 原点 矩 为 P = E(X*) ， 则 有 

p, = MY (0), k=1,2,… 
并 且 和 矩 母 函数 M(t) 还 可 以 进行 如 下 的 Taylor 展开 : 


om k 

了 
M(t = 》 过 | 外交 
xz) 人 2 |zl 了 


性 质 3 若 XX,,X,,，…, ,为 相互 独立 的 随机 变量 ， 则 这 些 随 机 变量 
的 和 
S = 着 | 十 着 ,十 … 土 大 ， 
的 矩 母 函数 为 各 随机 变量 矩 母 函数 的 乘积 : 
M(t) = My (2) My CDM (2) 
性 质 4 车 Y=aX+b5，a,b 为 常数 ， 则 随机 变量 了 的 矩 母 淆 数 为 : 
Mi) = e”M,(at) - 
性 质 1 可 看 做 是 应 用 和 矩 母 函数 人 处理 分 布 孙 数 的 唯一 性 定理 ; 性 质 2 至 
性 质 4 则 是 关于 和 矩 母 函数 最 常用 的 性 质 ， 这 四 条 性 质 的 数学 证 明 可 参阅 有 
关 的 概率 论 教材 。 
由 于 我 们 经 常 要 用 到 正 态 分 布 ， 因 此 把 正 态 分 布 也 列 在 这 里 : 
1. 正 态 分 布 。 若 随机 变量 了 的 密度 函数 为 
f(x) = 1 2 


e 





,一 co<x<+oco， -co< 人 <+tco ,o>0 
TO 


称臣 服从 参数 为 (4 上, o ) 的 正 态 分 布 。 
这 里 我 们 仅 以 正 态 分 布 为 例 给 出 矩 母 函数 的 求解 过 程 ， 其 余 分 布 相 应 
的 求解 过 程 从 略 ， 请 读者 自己 证 明 。 正 态 分 布 的 矩 母 函 数 为 : 








+ 四 1 十 中 Lp? 
M,(i1) = E(e*) = ef(x) dx = e” xe™’(") dx 
. |. 
三 1 | orioe ve x ca 
V2TO -= 
标准 正 态 随机 变量 ~ N(0, 1) 的 矩 母 函数 为 : 
M(t = er 
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2. 指数 分 布 。 若 随机 变量 三 的 密度 函数 为 
f(x) = er， x>0,06>0 


其 中 9 是 常数 ， 则 称 服从 参数 为 8 的 指数 分 布 。 指 数 分 布 的 矩 母 函数 为 : 


M(t) = (1-60) 0<t < 本 


指数 分 布 的 期 望 、 方 差 和 上 下 阶 原 点 和 矩 为 : 
E(X) = 0, Var(X) = 0 , E(X') = T(k+1)0 
我 们 在 第 二 章 中 曾经 介绍 过 指数 分 布 ， 它 可 以 用 于 拟 合 个 体 寿 命 。 
3. 人 徊 玛 分 布 。 若 随机 变量 瑟 的 密度 函数 为 





a >0,06>0,x>0 
其 中 T(a) = | cea ， 对 正 整数 上 ,FT(E+1I) = 1 ， 则 称 天 服从 参数 为 
(a,9) 的 分 玛 分 布 。 当 a = 1 时， 伽 玛 分 布 退化 为 指数 分 布 。 当 参数 9 = 1 
时 ， 人 和合 玛 分 布 称 为 标准 伽 玛 分 布 ， 其 分 布 函 数 记 为 : 
1 ca- -上 

T(x;a) ve edat 
人 和合 玛 分 布 的 矩 母 隔 数 为 : 

M(t) = El(e*) = (1 ~ 0t)™, 0 < < 也 

利用 和 抢 母 画 数 的 性 质 ， 容 易 计 算得 佩 玛 分 布 的 期 望 、 方 差 和 天 阶 原点 

和 矩 分 别 为 : 


E(X) = a0 
Var(X) = al 

k T(a tk) 长 加 
E(X) = Teay 0 ， 天 > 一 ae 


从 期 望 和 方差 的 表达 式 可 以 看 出 ， 当 a 固定 时 , 9 越 大 ， 伽 玛 分 布 的 期 
望 值 和 方差 也 越 大 ， 密 度 泪 数 将 向 右 偏 移 ， 同 时 趋 于 平缓 (如 图 4 -2 所 
示 )。 而 9 固定 时 , a 越 大 则 期 望 与 方差 越 大 ， 密 度 函 数 也 向 右 偏 移 (如 图 
4 一 3 所 示 )。 

伽 玛 随机 变量 一 个 常用 的 人 性质 是 可 加 性 。 如 果 忒 ，…，, 二 .是 分 别 服从 


参数 为 (w, 6) 的 互相 独立 的 伽 玛 随机 变量 , 则 了 = 立志 服从 参数 为 
( 六 ai, 6) 的 伽 玛 分 布 。 特 别 地 ， 若 已，…, 无 是 独立 且 参 数 都 为 6 的 指数 


随机 变量 ， 则 了 = 了 X 服 从 参数 为 (n,0) 的 伽 玛 分 布 。 
4. 帕 累 托 分 布 。 若 随机 变量 X 的 概率 密度 函数 为 





图 4 -2 伽 玛 随机 变量 的 分 布 密度 {aw=2)j 图 4-3 伽 玛 随 机 变量 的 分 布 密度 (9=2) 


a0” 
(x 十 0)"" 人 


则 称 匀 服从 参数 为 (a,9) 的 帕 累 托 分 布 。 帕 累 托 分 布 的 分 布 薄 数 为 F(x) 
= 1 - (二 4) 。 帕 累 托 分 布 的 矩 母 函 数 无 简单 表达 式 。 


f(x) = 


x>0,a >0,06>0 


利用 数学 归纳 法 ， 可 以 求 得 帕 标 托 分 布 的 下 阶 原点 矩 为 : 
BTGE+1I)TCa -大 ) 











E(X') = FCa) ，,—1<k<oa 
0 Oa 
E(X) = ; Var() = 
于 是 ， (天 ) mI > 1; Var(X) pe 


观察 帕 累 托 分 布 的 期 望 与 方差 表达 式 可 以 看 出 ， 


Var(X) = [E(X)] ,0 >2 





当 aw 一 o 时 , Var( 外 )A[E(X)] 趋 于 1。 事实 上 ， 可 以 证 明 ， 当 均值 j= 
E( 了 ) 保持 不 变 , 令 a 一 % ， 则 该 帕 累 托 分 布 收敛 到 指数 分 布 。 我 们 把 这 
一 结论 留 做 习题 。 

5. 对 数 正 态 分 布 。 假 设 随 机 变量 站 取 对 数 后 服从 正 态 分 布 N(j, o ) ， 
则 称 互 服从 参数 为 (kw, oo ) 的 对 数 正 态 分 布 ， 记 作 锐 ~ LN(j, oo ) 。 对 数 
正 态 分 布 的 密度 函数 为 : 


1 _{lnzx-p)? 
f(x) = 区 22 x>0 


V27TOXx 
分 布 函数 为 P(z) = | 外 于 一 的] ， 为 标准 正 态 随机 变量 N(0， 1) 的 分 布 





函数 。 对 数 正 态 分 布 的 矩 母 泪 数 无 简单 表达 式 , 但 是 我 们 可 以 利用 正 态 分 
布 的 和 矩 母 聘 数 ,计算 对 数 正 态 的 k 阶 原点 矩 为 : 


E(X') = est 
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精算 模型 


于 是 , BE(X) = 只 + Var(X) = ex (e" -1) 。 可 以 看 出 ， 对 数 正 态 分 布 
的 期 望 和 方差 都 是 参数 儿 和 wo 的 增 函 数 。 对 给 定 1 ， 当 0 0 时 ,， E(X) > 
re 0 

对 数 正 态 分 布 还 有 -一 个 非常 好 的 性 质 ， 即 可 乘 性 。 设 a 和 6 为 正 实数 ， 
区 服从 参数 为 六 和 的 对 数 正 态 分 布 ， 则 了 = aX' 仍 服从 对 数 正 态 分 布 ， 其 
参数 为 (by + Ina, bo?) 。 

6. 书 伯 分 布 。 若 随机 变量 XX 的 概率 密度 函数 为 

f(x) = Ye ， x>0,06>0,y>0 


则 称 关 服从 参数 为 (y, 9) 的 韦伯 分 布 。 当 yy = 1 时， 韦伯 分 布 为 指数 分 布 。 
韦伯 分 布 的 和 矩 母 函数 也 无 简单 表达 式 。 韦 伯 分 布 的 上 阶 原 点 和 矩 E(X*) = 
IT(1 + hy)6 ,kk > -7y ， 于 是 期 望 和 方差 为 : 

E(X) = 下 (1 +1/y)0”, 

Var(X¥) = 下 (1 +2/y)0 -[FCL +1/y)0”]’ 


$4.2 理赔 额 分 布 


4.2.1 带 有 免 周 额 的 理赔 额 分 布 
记 玉 为 保险 事故 造成 的 损失 人 额 ， 其 分 布 函 数 为 R(x) ， 记 了 为 保险 公 
司 根据 条 款 约 定 对 保单 支付 的 理赔 额 ， 其 分 布 际 数 为 f(y) ， 赔 款 工 可 以 
看 做 对 实际 损失 额 随机 变量 X 的 一 种 修正 ， 类 似 于 我 们 在 第 二 章 中 对 剩余 
寿命 了 作 的 各 种 截断 。 
在 考察 理赔 额 的 分 布 中 ， 有 两 种 常用 的 修正 形式 : 一 种 是 “ 左 截断 ”， 
也 就 是 第 二 章 中 所 说 的 “ 截 下 尾 ”， 即 考虑 免 赔 额 对 理赔 额 的 有 影响。 假设 
保单 规定 了 免 赔 额 4， 理 赔 额 Y 可 以 看 做 对 损失 额 X 的 截断 : 
Y= (X-d)|(xX> dg) 
了 表示 在 天 > d 的 条 件 下 ， 随 机 变量 -4d 的 分 布 ,，Y 是 一 个 条 件 随机 
变量 ， 其 取 值 范围 是 y > 0 。 
下 面 我 们 来 求 了 的 分 布 。 记 了 的 分 布 函数 为 Fj(y) ， 当 y > 0 时， 
Fy(y) = P(Y <7y) = P(X-d<y|X > 4d) 
~ Pla <X<y+d) Fl(y+d) -Fr(d) 
P(X > d) 1-F(d) 
因此 ,了 的 概率 密度 冰 数 为 ;: 


_ dF(y) _ fly +4d) 
fy(y) = a 0 
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4.2.2 带 有 保单 限额 的 理赔 额 分 布 
另 一 种 对 损失 额 的 修正 形式 为 “ 右 删 失 ”。 车 规定 了 保单 限额 为 :， 则 
了 为 理赔 额 ， 这 时 有 
a xY<! 
il, ZX >1 
革 是 连续 随机 变量 与 离散 随机 变量 的 混合 ， 容 易 计 算出 了 的 分 布 密度 函 
数 为 : 
AGOY) = f(y),y < 17 
在 1 点 的 概率 为 P(Y = /1) =1 F(l)。 
定义 4-2 设 拒 是 一 个 随机 变量 ， 给 定 实数 !， 定 义 有 限期 望 范 数 


E(XA1) = xf(x)dx + l[1 - F(L)] 


其 中 FE(x) 和 xz) 为 到 的 分 布 函 数 和 密度 函数 ,和 人 /的 含义 是 和 /的 最 小 
值 。 
对 于 非 负 随 机 变量 X, 已 (和 X 人 d) 对 任意 d >0 都 存在 ， 


E(X Ad) = | xf(x)dx +d[ll - F(d)] = 上 [1 ~- F(y)]dy 


尽管 上 面 第 二 个 等 式 的 证 明 不 难 ， 但 是 我 们 经 常会 用 到 这 个 公式 。 显 然 ， 
当 d 趋 于 无 穷 时 , E(XY 人 d) = E(X)。 

此 外 ， 在 保单 限额 为 1! 时， 理赔 额 的 期 望 E(Y) = E(X 人 1)。 

定义 4-3 设 X 是 一 个 随机 变量 ,给 定 实数 4， 定 义 剩余 期 望 鲨 数 


_ [ff'” (x-d)fl(x), _ E(X) ~ E(X A 4d) 
ex(d) = | a 一 和 


其 中 F(x) 和 入 x) 分 别 为 的 分 布 酒 数 各 密度 函数 。 
ex(d) 表示 随机 变量 关 比 4 高 出 的 平均 水 平 ， 即 在 和 > 4 的 条 件 下 ,XX- 
d 的 期 望 值 ， 即 免 赔 额 为 d 时 理赔 额 的 期 望 。 如 果 针 表示 产品 的 使 用 寿命 ， 
ex(d) 表示 产品 使 用 4d 的 时 间 长 度 后 独 余 的 平均 寿命 ， 相 当 于 第 二 章 中 的 
es, 因此 ex(d) 反映 了 随机 变量 的 尾部 性 质 ， 是 对 随机 变量 做 了 “插头 ”的 
处 理 ; 而 E(X 人 az) 则 反映 了 随机 变量 的 前 部 性 质 ， 是 作 “ 去 尾 ” 的 处 理 。 
【 例 4-1】 设 茶 险种 的 损失 额 (万 元 ) 具有 密度 渔 数 /(x) = 


324 
(3 +x)’ 


解 : 首先 理赔 额 了 可 以 表示 为 : 
Y= (X-0.5) |(X > 0.5) 
那么 ， 由 (4.2.1) 式 可 知 : 


E(Y) = E(X -0.5|X >0.5) = 


(4.2.1) 





> 0 ,假定 免 赔 额 4 为 0.5 万 元 , 求 理赔 额 了 的 期 望 。 


E(X) -~ E(X A 0.5) 
1 — F,(0.5) 





Sl-: 


324 324 人 81 

dy = 一 一 (3 = 1 - 一 一 一 一 
《3 十 y) 4 4 人 1， 《3 +%x)’ 
所 以 ,1 -有 (0.5) = 81/ (3.5)* = 0.5398 , 又 E(X) = 工 ， 
27 


E(X A 0.5) = 三 [1 -Fi(y)]dy =1 AS 0. 3703 





Fx) = 


—E(X 5 — 0. 370 
所 以, BUOY) = A165 
CE . 


【 例 4 一 2】 假设 实际 损失 人 额 X 服 从 参数 a = 2 和 参数 9 的 帕 累 托 分 布 ， 
已 知 3e,(100) = 5e:(50) ， 求 ev(150) 。 

解 : 对 于 帕 累 托 分 布 ， 其 剩余 期 望 函 数 
E(X) ~ E(X A d) 


























er(d) = 1 -F(ad) 
i | ls | _d+0 
= 
人 | (F<) 
又 由 已 知 a=2,， 因此 el(d) = d+0, 所 以 3(100 +9) = 5(50 +9), 从 而 得 
909=25， 因 此 e(d) = 150 +0 = 175。 画 


4.2.3 带 有 免 赔 额 、 保 单 限额 和 比例 赔偿 的 理赔 额 分 布 

定理 4-1 设 斑 表示 实际 损失 额 ， 分 布 函数 为 R(x)。 若 保单 规定 了 
免 赔 额 为 4， 保单 限额 为 1 以 及 赔付 比例 为 ※w， 则 平均 理赔 额 为 : 
a[ E(X A1l) -~ E(XA d)] 





E(YY 三 I Fd) (4.2.2) 
证 明 : 不 妨 设 为 连续 随机 变量 。 对 于 每 次 损失 额 X， 设 随机 变量 Y* 
如 下 : 
0 ， Xd 
了 ”= ,a( - d), d<X<l 
al(l - d), 互 演 1/ 


则 理赔 额 Y = Y* | (和 > d), 由 于 
E(Y*) = | [a(x -d)]jFrxz)yda+a -ad)[l -FFCD)] 
= «| xf( x) dx =&] xf(x)dx ~ ad[ F(1) - F(d)] 
+a(l-d)[1 - F(7)] 
=alf 区 flx)dx +ifl -PCD]] 让 [ f(x)dx +d[l -F(d)]| } 


=a[E(X A1) ~ E(xXA ad)] 
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EE(Y’) _ a[lE(XA!)-E(XA4d)] 
所 以 ， EC(Y) Rd Rd (4.2.3) 


加 

【 例 4-3】 设 某 险种 保单 损失 额 X 的 概率 密度 函数 为 f(x) = 
0.04xe”“, x > 0 ,保单 约定 免 赔 额 为 5 个 单位 ， 保 单 限 额 为 25 个 单位 ， 
赔付 比例 为 80% 。 问 : 

(1) 保单 发 生 索 赔 的 概率 是 多 少 ? 

(2) 理赔 额 了 的 期 望 是 多 少 ? 

(3) 当 免 赔 额 从 5 个 单位 提高 到 10 个 单位 时 ,平均 理赔 人 额 将 会 发 生 什 
么 变化 ? 


十 


解 : (1) 由 已 知 F(x) = [ fa = [ 0.04ieazdi =1 -ei， 可 得 : 


P(X >5) =1-F(5) =2e” = 73.58% 
即 保单 发 生 索 赔 的 概率 为 73. 58% ; 
(2) 由 式 (4.2.2) 可 知 : 
_0.8 x[E(XA25) - E(XAS5)] 





E(Y 
人 1 — F(5) 
起 
而 E(XA25) = | 0.04x’*e™*dx + 25[1 — F(25)] 
0 
3 
= 0. o4 | wre“dx +25 x 6e- 
o 
= 10 -35e™” = 9.7642 
5 
E(X A 5) =:| 0. 04xzezdx +5[1 - F(5)] 
0 
5 
= 0. o4 | x2e2zdx +S x2e’! 
0 
= 10 -1Se… = 4.4818 
0.8[E(XA25) ~- E(XAS5 0. 8(9.7642 - 4. 4818 
0 ) 





1 -天 (5) 0. 7358 
= 3. 7433 


(3) 因为 E(X 人 10) 和 0. 04x*e "2*dx +10[1 — F(10)] 


10 
0. o4 | wierdx +10 x3e- 
0 


10 - 20e™” = 7. 2933 
所 以 提高 了 免 赔 额 后 的 平均 理赔 额 为 : 


_ 0.8 x[E(X A25) ~ E(X A 10)] _ 0.8(9.7642 -7.2933) 
1 -天 (10) 四 3e™ 


E(Y') 


= 4.8687 
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EC(Y) ~- EC(Y'’) 


平均 免 赔 额 下 降 的 比例 为 “入? 翅 


= 15.23%。, 面 


4.2.4 通货 膨胀 对 理赔 额 分 布 的 影响 

在 拟 合 损失 分 布 时 ， 我 们 所 使 用 的 经 验 数 据 来 自 过 去 某 一 时 期 内 的 损 
失 额 或 理赔 额 ， 而 我 们 所 关心 的 是 当前 或 未 来 某 一 时 期 内 的 损失 额 或 理赔 
额 的 状况 。 随 着 时 间 的 推移 ， 同 一 险种 的 损失 额 自然 会 发 生变 化 ， 其 中 通 
货 膨胀 (以 下 简称 “通胀 ”") 效应 就 是 经 常 发 生 的 一 种 。 下 面 分 两 种 情况 
讨论 通胀 效应 问题 。 

1. 通胀 率 是 确定 的 实数 。 设 针 表 示 某 险种 今年 的 每 次 实际 损失 额 ， 分 
布 函数 为 Ff,(x) ， 预 计 通 胀 率 为 r，2 为 该 险种 明年 的 预计 损失 额 ， 则 2 = 
(1 + 站 )X ， 其 分 布 函数 为 : Fz(z) = PL(1+r)X<zs] = (5 


1 十 





密度 函数 为 : 
fz(z) = E 一 一 ) 


l+r\1l1+r 





且 有 
E(2) = (1 +r)E(X), ，Far(Z) = (1 +7r)’Var(X) 
下 面 我 们 来 研究 预计 理赔 额 的 分 布 。 假 设 免 赔 额 4、 保 单 限额 1 以 及 赔 
付 比例 a 在 通胀 前 后 保持 不 变 ， 设 匀 为 损失 额 ， 定义 Y” 如 下 : 

















da 
0， 六 
Y” = af(l +r)X -dl], es 
all - d), X= 
1+r 
则 通胀 后 预计 的 每 次 理赔 额 为 Y= 六 | (X > 一 <-) ， 类 似 于 定理 4 -1 的 


证 明 ， 可 以 计算 通胀 后 的 平均 理赔 额 为 : 
a(l +r){E[X A (U1 +7))1 -EI[XA (d/ (1 +7))]! 


1 一 有 (人 





五 (了 ) = 





(4.2.4) 
【 例 4-4】 假设 某 险 种 2009 年 的 每 次 实际 损失 额 X 服 从 离散 分 布 ， 
P(X = 1 000k) = 1/6,k = 1,…，6 。 保 单 约 定 每 次 损失 的 免 赔 额 为 2 000 
元 。 假 设 从 2009 年 到 2010 年 的 通胀 率 为 4 多 且 免 赔 额 保持 不 变 ， 求 2010 
年 的 平均 理赔 额 。 与 2009 年 相 比 , 平均 理赔 额 发 生 了 什么 变化 ? 每 次 损失 
的 平均 赔付 额 发 生 了 怎样 的 变化 ? 这 说 明 什 么 ? 
解 : 由 已 知 























E(X) = 二 (1 1+24+3+4+4+4+5+6) x1000 = 2 000 
E(XA2000) = x1000 +3*2000 .1000 
6 6 6 
2000\ 1 5 x2 000 11040 
E(x 人 a Gl exor x1L04 
那么 ， 由 式 (4.2.1) 可 知 2009 年 的 平均 理赔 额 为 : 
E(X) _ E(X A2000) 10 000/6 
y) = 人 
St 1 — F(2 000) 1 173 99 
再 由 (4.2.4) 可 知 2010 年 的 平均 理赔 额 为 : 
2 000 21 000 11 040 
1.04 x[ECX)-E 2 000 1.04 _ 
Be x [ECX) (xA ea ~( 6 0 
. i 1-1/6 
1.04 


Il 


2 160 
E(Y')/E(Y) =2 160/2 500 =0.8640， 这 说 明 平 均 理 赔 额 下 降 了 13. 60% 。 
2009 年 每 次 损失 事件 的 平均 赔付 额 为 : 
E(Y’) = E(X) -~ E(X A 2 000) = 10 000/6 
2010 年 每 次 损失 事件 的 平均 赔付 额 为 : 


~ 2 000 
EC(Y )1.04 x [EC(X) E(x ros)] 1 800 
iv a 人 1 800 
所 以 ， 相 比 2010 年 比 2009 年 每 次 损失 的 提高 了 T00075 -1 =8%。 


这 个 例子 说 明 ， 通 胀 会 增加 理赔 的 成 本 ,特别 是 当 保 单 约 定 了 人 免 赔 额 
时 ， 通 胀 的 影响 可 能 会 被 放大 ， 这 其 中 的 主要 原因 是 通胀 前 低 于 免 赔 额 的 
损失 在 通胀 后 可 能 会 引起 赔付 ， 因 此 每 次 损失 的 平均 赔付 额 增 加 了 。 但 是 
由 于 小 额 赔付 增加 ， 导 致 每 次 理赔 事件 的 理赔 额 减 少 了 。 本 

2. 通胀 率 是 随机 变量 。 在 很 多 情况 下 ， 通 胀 率 是 不 确定 的 。 设 扎 表 示 
某 险种 今年 的 每 次 实际 损失 额 ， 通 货 膨 胀 率 随机 变量 为 C， 随 机 变量 C 和 
起 独立 ， 了 为 该 险种 明年 的 预计 损失 额 ， 则 了 = CX。 

设 世 的 分 布 函数 为 f(x, 0) , 9 为 参数 ，5 的 分 布 函 数 为 Fe(c),， 密度 
为 f.(c)。 假设 对 应 任意 实数 c<， XX 的 分 布 满足 F(x, 6) = Fi(x, c6) 由。 于 
是 ， 


Fy(y) = | Plcx <y|C = c)f.(ec)de 


S | Faly,0)fele) de = | Fr(y,e0)fele) de 





@ 若 分 布 族 {Fx(x, 9), 9 e @j 满足 Fx(x, 0) = Fx(x, c9), 其 中 c 是 实数 ,c9 e @ 则 称 该 分 布 族 为 
尺度 不 变 分 布 族 ，9 称 为 尺度 参数 。 本 书 所 涉及 的 分 布 族 都 是 尺度 不 变 分 布 族 。 
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0) = { fi(ysc0)fele) de 


容易 计算 出 ,第 二 年 损失 额 了 的 期 望 和 方差 为 : 
E(Y) = E(CX) = E(C)E(X) (4.2.5) 
Var(¥Y) = Var(X)E(C’) + (E[X])’Var( C) (4.2.6) 
公式 (4.2.6) 的 证 明 请 读者 自己 练习 。 
【 例 4-5】 经 验 数据 显示 明年 的 通胀 率 在 2% ~6% 之 间 ， 而 且 低 通胀 
率 的 可 能 性 更 大 。 如 果 茶 险种 的 实际 损失 额 X 服 从 均值 为 1 万 元 、 标 准 差 
为 500 元 的 伽 玛 分 布 ， 试 预测 明年 损失 额 的 均值 与 标准 差 。 
解 : 由 已 知 ， 不 妨 假 设 C 的 概率 密度 号 数 为 : 


fele) 1,1.02<c<1.06 


CC 


其 中 a = | de = mm( 凸 99] = 0.038466 。 这 个 概率 密度 函数 满足 低 通 货 


1.02 CC 


膨胀 率 的 可 能 性 更 大 的 假设 条 件 。 经 计算 ， 有 
'™% 1.1, _1.06-1.02 








E(C) = | Cr = 1.0399 
1.02 a C a 
1.06 2 5 2 

gcc) = | A, A 
1.02 a c 2a 


则 由 公式 (4.2.5)、(4. 2.6) 计算 得 到 : 
E(Y) = E(C)E(X) = 1.0399 x 10 000 = 10 399 
Var(¥Y) = Var(X)E(C’) + (E[X]1)’Var( C) 
= 250 000 x 1.0815 + 10 000’ x (2. 1629 - 1.0399’) 
= 527. 10° 
因此 明年 损失 额 的 均值 与 标准 差分 别 是 10 399 元 和 527. 10 元 。 [J 


形成 保单 总 赔付 额 不 确定 性 的 另 一 个 原因 是 理赔 次 数 的 不 确定 性 。 
本 节 将 讨论 单个 保单 〈 也 可 称 为 个体 保单 ) 以 及 保单 组 合 的 理赔 次 数 
分 布 。 

由 于 保单 理赔 次 数 取 值 都 是 非 负 整 数 的 特点 ， 这 一 节 我 们 将 讨论 计数 
随机 变量 的 分 布 。 计 数 随 机 变量 是 仅 在 非 负 整 数 上 有 概率 的 离散 随机 变量 ， 
它 既 可 以 用 来 描述 损失 次 数 ， 也 可 以 用 来 描述 理赔 次 数 。 

对 于 离散 随机 变量 ， 除 了 可 以 利用 和 矩 母 画 数 得 到 其 各 阶 矩 外 ， 更 为 简 
便 的 方法 是 使 用 概率 母 聘 数 。 

定义 4-4 离散 随机 变量 NN 的 概率 分 布 函数 为 mm = P(N=k), k=0， 


1，2，…， 其 概率 母 函 数 为 P,(t) = EC) = 3 pt。 

与 矩 母 函 数 类 似 ， 由 概率 母 函数 也 可 以 得 到 随机 变量 的 矩 : P;(1) = 
E(N) ,PX1) =ELN(N -1)]， 并 且 还 可 以 由 概率 母 函 数 得 到 随机 变量 取 不 
同 值 的 概率 ， 因 为 





PC (4) =E| 3 


| =E[N(N-1)-(N-m+1)e"] 


= > kl(k 11)...(k—- m+1)t"p, 


P'™ (0O 
所 以 , PY(0) = mlp, ,m= 1,2,…。 即 p, = 2 2 


男 外 ， 由 定义 ， 和 矩 母 旺 数 和 概率 母 函数 还 存在 如 下 关系 : 
M(t) = E(e”) = P,(e') (4.3.1) 





m= 1,2,.… 。 


4.3.1 单个 保单 的 理赔 次 数 分 布 

1， 治 松 分 布 。 随 机 变量 NN 服从 参数 为 的 泊 松 分 布 ， 记 做 N ~ P(X) ， 
其 概率 分 布 函 数 为 : p， = .后 ,k=0,1,2,… 容易 计算 得 到 ， 泊 松 分 布 的 
概率 母 函 数 、 期 望 和 方差 为 : 


P,(i) = by pit* = e* (4.3.2) 
E(N) = ey = 入 (4.3.3) 

我 们 经 常 使 用 的 泊 松 分 布 其 实 是 泊 松 过 程 的 单位 化 ， 其 背景 如 下 : 保 
单 的 损失 次 数 是 指 在 单位 时 间 内 保单 发 生 损 失 的 次 数 。 对 一 张 特 定 保 单 来 
说 ， 保 单 的 损失 事故 可 看 做 是 稀有 事件 ， 因 此 可 以 假定 它 的 损失 次 数 过 程 
N(t) (随机 过 程 W(i) 表示 区 间 [0, 1] 内 发 生 的 损失 次 数 ) 具有 如 下 特性 : 

(1) 当 上 = 0 时， 保单 损失 次 数 为 0, 即 N(0) = 0。 

(2) 在 [it + At] 内 保单 发 生 损 失 这 一 事件 与 时 刻 :以 前 的 损失 事件 相 
互 独立 ， 而 且 发 生 的 损失 次 数 只 与 时 间 长 度 At 有关， 与 时 间 的 起 始 位 置 无 
关 。 也 就 是 说 , N(:) 是 一 个 平稳 独立 增 量 过 程 。 

(3) 在 充分 小 的 时 间 间 隔 At 中 ， 至 多 有 一 次 损失 ,上 且 发 生 一 次 损失 的 
概率 与 此 时 间 区 间 的 长 度 有 关 ， 而 发 生 两 次 或 两 次 以 上 的 损失 概率 是 4t 的 
无 穷 小 量 。 即 

P(N(At) = 1) AAt + ol Ai) 

P(N(At1) > 2) = ovo(Ai) 
满足 上 述 三 个 条 件 的 随机 过 程 称 为 “ 泊 松 过 程 ”"。 在 [0, t] 内 保单 发 生 上 次 
事故 的 概率 为 : 


线 


Se 
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eR fe py A ee sr fs Ce Se eo ee 3 
PONGs) = k) = em 人 AD ,= 0,1,2,. (4. 3.4) 

令 :=1， 则 单位 时 间 内 损失 次 数 NN 的 概率 分 布 函 数 为 : 
p: = P(N = £) = (4.3.5) 


显然 ,，N 服从 泊 松 分 布 。 

泊 松 分 布 具 有 两 个 非常 有 用 的 性 质 : 可 加 性 和 可 分 解 性 。 可 加 性 是 指 
有 限 个 独立 泊 松 随机 变量 的 和 依然 服从 泊 松 分 布 。 这 一 性 质 可 以 用 下 面 的 
定理 表述 : 

定理 4-2 设 N,，N,，-…, NV, 是 独立 的 泊 松 随机 变量 ,参数 分 别 为 
AAA 则 NW=N+mN+…+NV 服 从 泊 松 分 布 ， 参 数 为 和 = A + A， 
a + 和 A,o 

证 明 : 首先 ， 独 立 随机 变量 和 的 概率 母 图 数 具 有 和 和 扼 母 羡 数 性 质 3 类 
似 的 性 质 ， 再 由 式 (4. 3.2) 可 以 得 到 WN 的 概率 母 函 数 为 : 


Pi{z) = Il P,(z) = Il exp(A(z—~1)) = exp( 之 A,(z—1)) 
故 N 服从 泊 松 分 布 ， 参数 为 A = A, + A, + … +A,o 加 

泊 松 分 布 的 可 加 性 可 用 来 判断 保单 组 合 总 损失 次 数 的 分 布 。 假 设 一 个 
保单 组 合 有 m 份 保单 ， 其 中 每 份 保单 发 生 损 失 的 次 数 服从 参数 为 A 的 泊 松 
分 布 ， 则 根据 泊 松 分 布 的 可 加 性 可 知 ， 这 个 保单 组 合 发 生 总 损失 的 次 数 服 
从 参数 为 mA 的 泊 松 分 布 。 

泊 松 分 布 另 一 个 有 用 的 性 质 是 可 分 解 性 ， 这 是 一 个 与 可 加 性 对 立 的 性 
质 。 假 设 损失 事故 可 以 分 为 m 个 不 同类 型 C,，C:,，…，C,。 且 相 互 独立 。 记 
E, 表示 第 i 类 事故 发 生 , p, = P(E,) 表示 第 i 类 事故 发 生 的 概率 ，N, 表示 第 : 
类 事故 发 生 的 次 数 ，i=1, 2，…，m, N= N+N,+… +N。, 表示 所 有 事故 
发 生 的 次 数 。 若 损失 事故 发 生 的 次 数 N 服从 泊 松 分 布 , 下面 的 定理 将 证 明 
第 i 类 事故 发 生 的 次 数 服从 参数 为 Ap, 的 泊 松 分 布 : 


定理 4-3 车 和 NN 服 从 参数 为 A 的 泊 松 分 布 ， 则 N,，N,，*…，N。, 相互 
独立 ， 且 服从 泊 松 分 布 ， 参 数 分 别 是 Ap;, i=1, 2, …,， mo。 


证 明 : 为 证 明 本 定理 ,， 先 引入 多 项 分 布 的 概念 ， 设 一 个 随机 试验 E 可 


能 产生 m 个 不 同 的 结果 ， 出 现 第 i 个 结果 的 概率 记 为 7, ， > Ti =1， 重 复 


此 试验 n 次 ,并 记 n 次 试验 中 结果 i 出 现 的 次 数 为 N, , = 1,2,…,m，》 
N, =n， 则 


ni! hs 区 
Pi{N, = nN, = mV。= nl EE Ty Tn 


i 
1 
mlnl-n,! 


称 随机 向 量 (N,N,,…, N,) 为 具有 参数 (n, 7 ,…, 7。) 的 多 项 分 布 ， 多 





项 分 布 可 以 看 做 是 对 二 项 分 布 的 推广 。 
给 定 N=n 3 NICN < n) 服从 二 项 分 布 .Bl(n， pi) ? (Ci， N,, > 





N,) | (N = n) 服从 多 项 分 布 B(n, p,,，…, Ps。) 。 因 此 ， 
P(N = nn, 7 N, =n) = PON =n,:,N, =n,|N =n)P(N = n) 
_ nl! eA 
上 nln,ln 1! Pn nl 
A 


和 
其 中 ,n= n+t+n,+t+ 十 几 。 又 





P(N, = n,) = > P(N, =n|N = n)P(N = n) 
ns, We 
= 之 (je — Pp;) nt 
-A 《AP)) All~p) _ -ap (Ap,)” 
一 二 六 e 一 e 本 
因此 ， N 3 (CN,, N,，, 人 AN ) 的 联合 概率 分 布 蚂 数 等 于 N,,， N,, ep N, 
概率 分 布 函 数 的 乘积 ， 从 而 证 明了 N,，N,，…， WN 是 相互 独立 的 随机 变 
量 。 一 


【 例 4-6】 考虑 某 项 医疗 保险 计划 ， 每 人 看 病 获 赔 的 次 数 服从 均值 为 
2.3 的 泊 松 分 布 ， 保 险 公 司 为 减少 赔付 次 数 ， 从 保单 中 去 掉 一 个 保险 项 目 。 
根据 历史 数据 ， 该 项 目 损失 事故 发 生 的 概率 为 0.1 。 请 问 去 掉 这 个 项 目 后 ， 
每 人 看 病 后 获 赔 次 数 的 期 望 值 是 多 少 ? 

解 : 设 NN 表示 病人 总 共 获 得 赔偿 的 次 数 , N, 表示 被 撤销 项 目的 获 赔 次 
数 , N, 表示 未 被 撤销 项 目的 获 赔 次 数 。 根 据 泊 松 分 布 的 可 分 解 性 , N, 、NN, 均 
服从 泊 松 分 布 ， 每 人 看 病 后 获 赔 次 数 的 期 望 值 是 E(N,) =2.3 x0.9=2.07。 

者 

【 例 4-7】 设 表示 保 单 理赔 次 数 , 针 表示 理赔 额 。N 服从 均值 为 10 
的 泊 松 分 布 , 关 服 从 区 间 [0,20】 上 的 均匀 分 布 ， 求 发 生 两 次 理赔 额 超 过 5 
的 理赔 事件 的 概率 ? 

解 : 令 M 表示 理赔 额 超过 5 的 事故 次 数 ， 因 为 


20 1 
P(X > 5) = | 204x = 0.75 
1 


由 定理 4-3，M 服从 参数 为 10 x 0.75 = 7.5 的 党 松 分 布 ， 所 以 ， 


2 
7.5 es = 0.0156 


P(M =2) = 1 号 





泊 松 分 布 的 均值 和 方差 相等 ， 但 在 实际 运用 中 ， 并 不 是 所 有 险种 的 保 
单 损失 次 数 或 理赔 次 数 的 均值 都 等 于 方差 ,在 这 种 情况 下 ， 还 需要 考虑 其 
他 的 计数 分 布 ， 如 负 二 项 分 布 、 二 项 分 布 等 。 
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.60 . 


2. 负 二 项 分 布 。 随 机 变量 N 服从 参数 为 r 和 p 的 负 二 项 分 布 ， 记 做 
N ~ NB(r,p) ， 其 概率 分 布 消 数 为 : 


r+t+k—-l rk | 
p= PN = 月 =| jg8 9<p<Dp+e=LlE=01L2 
k 


x(x—1).…(x~k+1) 


了 ,大 为 整数 ，* 为 任意 正 实 


其 中 二 项 式 系数 为 | 
数 。 当 > 二 1 时 ， 称 N 服从 参数 为 p 的 几何 分 布 。 
不 难 证 明 负 二 项 分 布 的 概率 母 函数 为 : 

1 





ee A 
P(i) a re (4. 3.6) 
由 此 得 到 负 二 项 分 布 的 均值 和 方差 : 
E(N) = 辽 ， Var(N) = 近 (4.3.7) 


因为 0 <p < 1 ， 所 以 负 二 项 分 布 的 均值 小 于 方差 。 注 意 到 泊 松 分 布 的 均值 
和 方差 相等 ， 这 说 明 如 果 观 测 数 据 的 均值 小 于 方差 时 ， 负 二 项 分 布 比 泊 松 
分 布 更 合适 。 


= 于 ， 即 B= 人， 也 可 以 说 NN 服从 参数 为 + 和 的 负 二 项 


分 布 ， 我 们 称 之 为 “奇异 负 二 项 分 布 ” ， 记 做 N ~ NB(r, B) ， 此 时 其 概率 
母 函 数 为 : 





车 令 p 


1 


P(i:) = [1 ~-B(t ~1)]™, i (4.3.8) 
均值 和 方差 分 别 是 : 
E(N) = 1B, Var(N) = rB(1 +B) (4.3.9) 


3. 二 项 分 布 。 随 机 变量 N 服从 参数 为 n 和 的 二 项 分 布 ， 记 做 NN ~ 
B(n,p) ， 其 概率 分 布 函数 为 Pp = P(N = = | pe ,0<p<lpt+9- 


1,k = 0,1,2,…,n 。 二 项 分 布 的 概率 母 函 数 、 均 值 和 方差 如 下 : 
P(i) = (pt + gqg)” (4. 3. 10) 
E(N) = np,Var(N) = npg (4.3.11) 
可 以 看 出 ， 二 项 分 布 的 均值 大 于 方差 ,因此 适用 于 拟 合 样本 均值 大 于 
样本 方差 的 数据 。 除 此 之 外 ， 二 项 分 布 的 取 值 范围 有 限 ， 这 使 得 它 比 较 适 
合 描述 理赔 次 数 有 限 的 索赔 情况 ， 例 如 ， 意 外 伤害 保险 的 出 险 次 数 ， 交 通 
事故 的 发 生 次 数 。 另 外 ， 如 果 认 为 随机 变量 超过 某 个 值 的 概率 非常 小 的 话 ， 
那么 也 可 以 近似 地 认为 这 个 随机 变量 服从 二 项 分 布 。 
4. 泊 松 分 布 与 负 二 项 分 布 的 关系 。 在 保险 实务 中 ， 不同 的 保单 类 型 或 
同一 保单 类 型 在 不 同 保险 期 间 的 平均 理赔 次 数 是 一 个 随机 变量 ， 也 就 是 说 ， 


如 果 理 赔 次 数 NN 服从 均值 为 人 的 泊 松 分 布 ， 参 数 和 是 随机 的 ， 记 做 人 A ， 设 
A 的 概率 密度 函数 为 x(A) .A > 0 ， 也 就 是 说 ， 当 A 取 定 为 某 个 值 A 后， 
N 服从 参数 为 A 的 泊 松 分 布 ,， 运 用 全 概率 法 则 ， 可 得 NN 的 最 终 (无 条 件 ) 
分 布 : 


P(N = nm) = | P(N = n|A = A)u(A) dA 





| Ae ,(A)dA 
0 


nl! 
由 (4.3.3) 还 可 以 得 到 NN 的 无 条 件 期 望 和 方差 但 是 需要 用 到 下 面 的 
命题 : 
命题 4-1 设 和 YY 是 任意 的 随机 变量 ,而 且 数 学 期 望 和 方差 都 存 
在 ， 则 有 : 
E(X) = E[E(X|Y)] (4. 3. 12) 
Var(X) = ErlVar(X|Y)] + Var [E(X|Y)] (4.3.13) 
大 多 数 的 概率 统计 教材 中 都 有 关于 这 个 命题 的 证 明 ， 这 里 不 再 重复 ， 
请 读者 自行 参阅 。 
有 了 命题 4-1， 再 由 式 (4.3.3) 可 得 : 


E(N) = E[E(N|A)] = E[A] (4. 3. 14) 
Var(N) = E[Var(N|A)] + Var[ E(N|A)] 
= E(A) + Var( A) (4.3.15) 
Muv(i) = E(e") 
= E[E(e” |A)] = EL[e*”™] 
= M,(e -1) (4.3. 16) 


因此 ， 可 以 得 到 如 下 负 二 项 分 布 与 泊 松 分 布 关 系 的 定理 : 
定理 4-4 车 已 知 当 A 取 定 为 某 个 值 和 A 后 ,，N 服从 参数 为 A 的 泊 松 分 
布 ， 而 且 A 服从 伽 玛 分 布 ,参数 为 (w,9) ， 则 NN 的 无 条 件 分 布 为 奇异 负 二 
项 分 布 ， 参 数 分 别 为 : 
r=a,B=0 (4.3.17) 
证 明 : 由 人 服从 伽 玛 分 布 , 参 数 为 (ww,9) 可 知 其 矩 母 泡 数 为 : 


Mi) = (1-0)" ,0 < :< 也 
将 其 代 人 式 (4.3.16) ， 有 
Mt) -Me -iD = [1 -600-1)]*,0<t<In(l +) 


对 照 式 (4.3.1) 和 (4.3.8) 可 知 ,，N 服从 参数 为 (r,6) 的 负 二 项 分 布 。 
了 


【 例 4-8】 茶 保 单 承保 了 个 学 生 为 期 一 周 的 团体 意外 伤害 保险 ， 保 


。 61: 


精算 模型 


. 62. 


险 责 任 是 死亡 。 假 设 这 nn 个 学 生 是 独立 同 分 布 的 风险 个 体 ， 死 亡 率 均 为 p， 
求 这 个 团体 总 理赔 次 数 的 分 布 ? 

解 : 根据 题 意 ， 设 每 个 学 生 的 理赔 次 数 为 N,,i = 1,2,…,n ， 它 服从 参 
数 为 p 的 两 点 分 布 〈( 贝 努 里 分 布 ) ， 其 概率 母 函 数 为 P,(1) = pt + 9 ; 再 设 
团体 总 理赔 次 数 为 VY， 因为 独立 随机 变量 和 的 概率 母 泪 数 是 概率 和 母 小 数 的 
乘积 ， 所 以 有 Pi(t) = (Pi(t))" = (pt + g)"o 


由 概率 母 函 数 的 性 质 , 可 证 明 P(N = h) = ("jp'g*,0 <p<1pta=1， 


-上 =0,1,2,…,n ， 这 说 明 团体 总 理赔 次 数 服 从 参数 为 n 和 p 的 二 项 分 布 。 


国 

【 例 4-9】 Daykin (1994) 记录 了 英国 某 种 综合 汽车 保险 1968 年 的 
索赔 情况 。 共 计 观 察 了 421240 张 保 单 ， 具 体 的 理赔 次 数 记 录 列 在 表 4 -1 
中 。 试 分 析 该 组 数据 适用 的 分 布 和 参数 估计 。 

解 : 经 过 简单 的 计算 ， 可 得 这 组 观测 的 平均 理赔 次 数 是 0. 13174， 样 本 
方差 是 0. 13825 。 因 为 两 者 比较 接近 ， 所 以 考虑 泊 松 分 布 。 泊 松 参数 的 估计 
值 外 为 平均 理赔 次 数 0. 13174。 

为 了 对 比 不 同 分 布 的 拟 合 效果 ， 还 可 以 考虑 用 负 二 项 分 布 来 拟 合 。 对 
于 负 二 项 分 布 ， 车 以 N 表示 样本 均值 、s 表示 样本 方差 ， 则 由 式 (4. 3.7) 
式 可 得 参数 估计 : 


表 4 -1 例 4~9 的 理赔 次 数 记 录 及 参数 估计 


















~ _N 
b= =0.951 泊 松 分 布 负 二 项 分 布 
.i (A =0.13174) | (人 =0.951,? =2.555) 
人 = PN = 2.555 369 246 370 460 
-Pp 
1 48 644 46 411 
表 4 -1 对比 了 理赔 次 数 的 
之 3 204 4 045 






实际 观察 值 、 泊 松 分 布 的 估计 
值 和 负 二 项 分 布 的 估计 值 。 读 
者 还 可 以 用 x 分 布 来 检验 拟 合 
的 情况 。 
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4.3.2 (2，D，0) 分 布 类 和 (a,，b，1) 分 布 类 

1. (a,b,0) 分 布 类 。 

定义 4-5 计数 随机 变量 N 的 概率 分 布 函数 为 mn ， 若 存在 常数 使 得 下 
式 成 立 : 


pr 


PE k=1,2,3,.… (4.3.18) 
Pir-1 E 


第 四 章 理赔 额 和 理赔 次 数 的 分 布 














-号 i Sa i ge tpg. i En ed i ~ i a i + Wi ips de i el “i 
则 称 随 机 变量 NN 属于 (acC，5， 表 4 -2 (a, 6,，0) 类 的 分 布 
0) 分 布 类 。 (a, b， 0) 分 布 类 分 布 a b po 
是 一 个 两 参数 分 布 族 ， 参 数 分 泊 松 分 布 0 A eA 
别 是 " 和 2 。 负 二 项 分 布 | 1-p |(-DG-m | pr 
将 泊 松 分 布 、 负 二 项 分 布 

和 二 项 分 布 的 概率 分 布 函数 代 几何 分 布 9 ? 
人 式 (4.3.18) 的 左边 ， 可 以 二 项 分 布 a (n+1) 2 g” 

g 2 











看 出 三 个 分 布 均 满 足 该 递 推 公 
式 ， 如 表 4 -2 所 示 ， 由 于 几何 分 布 是 负 二 项 分 布 参 数 r = 1 时 的 特例 ， 所 
以 表 4 -2 也 给 出 了 几何 分 布 的 参数 值 ， 同 时 表 4 -2 也 列 出 了 这 四 个 分 布 
的 pe 值 。 

可 以 证 明 ， 也 只 有 这 些 分 布 满 足 上 述 的 递 推 公式 。 递 推 公 式 (4. 3. 18) 
也 可 以 表示 为 : 
Pp 


— =ak+b, k=1,2,3,. (4.3.19) 
Piri-1 


k 


由 式 〈4. 3. 19) 可 以 看 出 ， 函 数 上 请 是 上 的 线性 函数 ， 它 的 图 形 是 一 条 余 


率 为 a、 截 距 为 b 的 直线 。 
由 表 4 -2 可 以 看 出 ， 泊 松 分 布 、 负 二 项 分 布 和 二 项 分 布 的 斜率 a 分 别 
是 0、 正 数 和 负数， 这 一 特点 可 以 帮助 我 们 选择 合适 的 理赔 次 数 分 布 。 首 
先 ， 我 们 可 以 按照 下 面 的 近似 公式 画 出 关于 大 的 图 形 : 
5 元 T (mw 表示 发 生 上 次 事故 的 保单 数 ) (4. 3. 20) 
若 由 观测 值 画 出 的 图 形 近 似 是 一 条 直线 ， 那 么 大 致 可 判断 其 属于 (a， 
2，0) 分 布 族 ， 直 线 的 斜率 表示 适用 的 模型 。 需 要 注意 的 是 ， 如 果 样 本 数 
据 中 出 现 了 某 个 n 为 0， 那 么 这 种 方法 就 不 太 适 用 。 
2. (a, 4b, 1) 分 布 类 。 在 保险 实践 中 ， 我 们 发 现 有 时 候 (a, 8,， 0) 分 布 不 
能 充分 地 反映 经 验 数据 的 特征 ， 特 别 是 端点 的 特征 ， 而 非 寿 险 业 务 中 免 赔 
额 和 保单 限额 的 存在 又 使 得 理赔 次 数 的 分 布 很 容易 出 现 端点 特别 是 零点 的 
概率 异常 。 理 赔 次 数 在 零点 的 概率 表示 保单 在 观察 期 内 没有 发 生 索 赔 的 概 
率 ， 由 于 保险 事故 发 生 的 比率 一 般 都 很 低 ， 因 此 理赔 次 数 在 零点 有 较 大 的 
概率 值 。 考 虑 到 要 更 为 准确 地 拟 合 零 点 的 概率 值 ， 我 们 有 必要 对 (a, 5, 0) 
分 布 族 在 零点 的 值 作 调 整 。 
定义 4-6 设计 数 随机 变量 NN 的 概率 分 布 函 数 为 p, ，k 宇 0。 若 存在 常 
数 使 得 下 式 成 立 : 
Ps 
Pi-i 





=- at+ 志 ， k = 2,3,4，… (4. 3.21) 
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则 称 随机 变量 N 属于 (a,65,1) 分 布 类 。 

比较 (a, 5, 0) 分 布 类 和 (a, 5b, 1) 分 布 类 的 定义 ,我 们 发 现 ，(a, 6b, 1) 
分 布 类 与 (a,65,0) 分 布 类 唯一 的 区 别 是 递 推 从 p, 而 非 从 m 开始 ， 即 (c，5， 
1) 分 布 类 只 在 从 k = 1 到 = % 的 概率 值 之 间 存 在 递 推 关 系 ， 而 (a, 4b, 0) 
分 布 类 却 在 从 k = 0 到 k = o 的 概率 值 之 间 存 在 弟 推 关系 。 当 然 这 种 递 推 关 
系 可 能 不 同 ， 但 却 只 相差 一 个 常数 ， 也 就 是 说 两 类 分 布 在 从 大 = 1 到 
k = oo 的 概率 值 之 间 存 在 倍数 关系 ， 这 一 结论 可 以 在 定理 4 -5 的 证 明 过 程 
中 得 到 。 
从 另 一 角度 看 ，(a,65,1) 分 布 类 与 (a,5,0) 分 布 类 的 本 质 区 别 就 是 分 布 
在 零点 的 取 值 p。， 这 个 值 使 得 (a,b,1) 分 布 类 成 为 三 参数 的 分 布 : a,6,p。， 
而 (a,6,0) 分 布 类 只 是 含 两 个 参数 a 和 4。 的 分 布 类 。 

下 面 我 们 就 p。= 0 和 p。> 0 两 种 情况 来 分 别 讨论 : 

。 当 p。= 0 时 ， 随 机 变量 N 的 取 值 从 大 = 1 开始 ， 从 概率 分 布 函 数 的 
图 形 上 看 ， 相 当 于 在 (a,6b,0) 类 分 布 的 基础 上 再 截 去 零点 的 值 ， 这 一 类 分 布 
称 为 “零点 截断 分 布 ” (zero-truncation) 或 “2ZT 分 布 ”， 其 概率 分 布 函 数 
用 p! 表示。 零点 截断 分 布 包括 零点 截断 泊 松 分 布 、 零 点 截断 负 二 项 分 布 以 
及 零点 截断 二 项 分 布 。 

。 当 p。> 0 时 ， 随 机 变量 NN 在 各 点 的 取 值 是 由 (a,6,0) 类 修正 得 到 的 ， 
因此 称 之 为 “零点 修正 分 布 ” (zero-modification ) 或 “ZM 分 布 "， 其 概率 
分 布 函 数 用 p* 表示 。 可 以 看 出 ，(a, 5, 0) 分 布 类 属于 (a, 5, 1) 分 布 类 中 的 
零点 修正 分 布 类 ， 是 零点 截断 分 布 类 和 恒 为 0 的 随机 变量 的 混合 ， 这 一 结 
论 由 定理 4 -4 给 出 。 

定理 4-4 任 一 零点 修正 分 布 是 零点 截断 分 布 和 恒 为 0 的 随机 变量 的 
混合 。 


证 明 : 对 于 任 一 零点 修正 分 布 ， 其 概率 分 布 函数 为 内 ,kk = 0,1,2,… ， 








令 
ps -0p = Tp k=-1,2 
那么 有 
pr = (1 -po)prt tpodi, k=0,1,2,. 
其 中 , d。 = 1 ,d= 0 ,k = 1,2,… 。d, 正 是 恒 为 0 的 随机 变量 的 概率 分 布 函 
数 ， 而 pi 对 应 的 随机 变量 是 零点 截断 分 布 。 加 


定理 4-S$ 任 一 零点 修正 分 布 是 (aa，2，0) 分 布 和 恒 为 0 的 随机 变 
量 的 混合 。 

证 明 : 设 (a, 52, 0) 分 布 的 概率 分 布 函数 为 mm ， 概 率 母 晴 数 为 P(1) ; 
对 应 的 零点 修正 分 布 的 概率 分 布 函数 为 py ， 概 率 母 函数 为 P"(s) 。 比 较 
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(4.3.18) 和 (4.3.21) 知 存在 常数 < ， 使 得 





pr = cp ， k=1,2,3,.…, (4. 3. 22) 
则 有 
Pr(D = p+ Dp = pi +e pt 
= ps + ec[ P(t) - po] (4. 3. 23) 
再 把 P"(1) = P(1) =1 代 人 式 (4.3.22)， 有 1=pl+c(l 一 po。), 所 以 可 
1 一 Po 
得 c= 二 。 因 此 有 
— Po 


MM 


1~p 
Pt pe ttt) 一 po] 
0 





下 1 -po 
(1 下 x1 + 二 Pp(z) (4. 3. 24) 
1 =- Po 1 -po 


式 (4.3.24) 中 ,1 正 是 定理 4 -4 中 概率 分 布 函 数 为 di 的 随机 变量 的 
概率 母 油 数 ， 再 由 概率 母 漠 数 的 唯一 性 ， 我 们 就 证 明了 任 一 零点 修正 分 布 
是 (ga,5,0) 分 布 和 恒 为 0 的 随机 变量 的 分 布 的 混合 。 加 

由 定理 4-5 可知 ， 对 于 零点 修正 的 (a,28,1) 类 分 布 ， 其 概率 分 布 函数 
与 对 应 的 (ec,2,1) 类 分 布 的 概率 分 布 函 数 之 间 存 在 如 下 倍数 关系 : 

pr = Pp, ， A 吉 (4. 3. 25) 

【 例 4-10】 假设 某 车 队 理 赔 次 数 服从 零 修 正 泊 松 分 布 ， 泊 松 参数 为 
4。 经 验 数 据 表 明 ， 发 生 索 赔 的 概率 为 40% ， 在 这 种 零点 修正 的 条 件 下 ， 试 
给 出 车 队 发 生 3 次 索赔 的 概率 。 








Ff -4 2 = 和 
解 : 首先 由 题 意 可 知 pb =1 -0.4=0.6， 又 pi =e ,ps = Ye Ez 
0. 195367 ， 那 么 由 式 (4.3.24) 可 知 : 
9 
工 一 e 1 一 e 3 
这 说 明 ， 车 队 发 生 3 次 索赔 的 概率 已 经 由 19.54% 修 正 为 7.96% 。 图 


事实 上 ， 我 们 还 可 以 定义 更 一 般 的 (a,b5,k) 分 布 类 。 
3. (a, 5b, 有 ) 分 布 类 。 称 计数 随机 变量 入 属于 (a, 6b, 有) 分 布 类 ， 车 存在 
常数 使 得 下 式 成 立 : 


j=k+1,k+2,.. 
J 


,= P(N=)), j=0,1,2,. 
(a, 5b, 上 有) 分 布 是 一 类 具有 2 + 上 个 参数 的 分 布 。 
在 拟 合 理赔 次 数 的 经 验 数 据 时 ,使 用 (a, b, 0) 分布、(a, b, 1) 分 布 还 
是 (a, 5, 8) 分 布 ， 要 依 实 际 的 数据 而 定 。 当 假设 经 验 数据 属于 (oa ,6, 0) 分 
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布 时 ， 我 们 只 需 估 计 两 个 参数 : a 和 4b; 但 当 这 种 假设 没有 通过 假设 检验 
时 ,我 们 可 以 放宽 假设 为 (a, b, 1) 分 布 ， 这 样 就 需要 估计 三 个 参数 : a、4 
和 p。; 进一步 ， 如 果 (a, 5b, 1) 分 布 的 假设 也 没有 通过 假设 检验 ， 我 们 只 能 
假设 数据 属于 (a, b, 2) 分 布 甚至 (a, b, 3) 分 布 ， 等 等 。 如 此 ， 我们 就 需要 
估计 更 多 的 参数 。 


4.3.3 保单 组 合 的 理赔 次 数 分 布 

在 保险 实践 中 ,保险 公司 获得 的 是 同 险种 多 张 保单 的 总 损失 或 理赔 次 
数 ， 而 不 只 是 单个 保单 的 损失 次 数 。 因 此 ， 有 必要 研究 从 保单 组 合 中 随意 
抽取 一 份 保 单 ， 该 保单 的 损失 次 数 的 问题 ， 从 而 能 够 研究 保单 组 合 损失 次 
数 分 布 的 问题 。 

对 于 保单 组 合 ， 可 以 分 为 同 质 性 和 非 同 质 性 两 种 情况 来 考虑 。 同 质 性 
是 指 所 有 的 保单 相互 独立 ， 且 都 有 相同 的 风险 水 平 ， 即 各 保单 的 损失 额 分 
布 相 同 ， 损 和 失 次 数 的 分 布 也 相同 。 在 这 种 情况 下 ， 任 意 一 份 保单 的 风险 水 
平 都 代表 了 整体 的 风险 水 平 。 例 如 ， 若 假设 ” 份 个 体 保 单 的 损失 次 数 都 服 
从 参数 为 A 的 泊 松 分 布 ， 则 保单 组 合 的 损失 次 数 分 布 也 服从 泊 松 分 布 ， 其 
参数 为 A 。 但 是 ， 事 实 上 ， 没 有 任何 两 份 保 单 具 有 相同 的 风险 水 平 。 为 了 
保证 保单 组 合 的 同 质 性 ， 保 险 公 司 通常 根据 某 些 风险 分 级 变量 取 不 同 的 值 
将 不 同 的 被 保险 人 进行 分 组 ， 如 人 性别、 年 龄 、 地 域 等 。 风 险 分 级 变量 的 选 
取 虽 然 尽 量 使 得 同一 组 内 的 被 保险 人 具有 相似 的 风险 水 平 ， 但 是 由 于 经 济 
的 、 社 会 的 原因 ， 分 级 变量 不 可 避免 地 存在 一 些 缺 陷 。 因 此 ， 不 可 能 存在 
完全 同 质 的 保单 组 合 。 对 于 完全 非 同 质 性 的 保单 组 合 ， 可 以 考虑 混合 损失 
次 数 模型 。 

为 了 简化 问题 ， 我 们 假设 所 有 保单 的 损失 额 分 布 都 相同 ， 对 于 个 体 保 
单 ， 我 们 假定 损失 次 数 服从 泊 松 分 布 ， 分 布 的 参数 ^ 反映 了 其 风险 水 平 的 
高 低 。 在 同一 个 保单 组 合 中 ， 每 份 保单 的 参数 入 是 有 差异 的 。 因 此 ， 为 了 
要 擅 述 一 个 非 同 质 性 的 保单 组 合 的 损失 次 数 ， 就 首先 需要 确定 这 个 保单 组 
合 中 泊 松 参数 和 的 变化 规律 。 对 于 规模 较 小 的 保单 组 合 ， 可 以 考虑 分 组 的 
方法 ， 按 风险 水 平 的 高 低 将 被 保险 人 分 成 几 组 ， 每 个 泊 松 变量 取 有 限 的 值 。 
例如 ， 用 大 、 中 、 小 三 种 取 值 分 别 代 表 高 、 中 、 低 三 种 风险 水 平 。 对 于 规 
模 较 大 的 保单 组 合 ， 可 以 假设 其 中 的 泊 松 参数 服从 连续 分 布 。 以 u(A) 表 
示人 的 密度 函数 ,通常 称 为 “结构 吗 数 ”。 那 么 ， 从 保单 组 合 中 随机 抽取 
一 份 保单 的 损失 次 数 分 布 为 : 


k 
形 如 式 (4. 3. 26) 的 分 布 称 为 混合 泊 松 分 布 。 由 条 件 期 望 公式 ， 可 以 计算 
得 到 : 


”e 





k 
P(N = E) = | uA) dA , k=0,1,2,.. (4. 3. 26) 
0 四 
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E(N) = E[E(N|A)] = E(A) 
Var(N) = Var(A) + E(A) (4.3.27) 
由 此 我 们 可 以 看 出 ,混合 泊 松 分 布 的 一 个 显著 特点 是 方差 大 于 均值 。 
我 们 知道 ， 泊 松 分布 的 均值 等 于 方差 ， 因此 当 保 单 组 合 损 失 次 数 观 察 值 的 
样本 方差 大 于 其 均值 时 ， 可 以 判断 保单 组 合 中 存在 某 种 程度 的 非 同 质 性 ， 
而 且 方 差 越 大 于 均值 ， 这 种 非 同 质 性 就 越 严 重 。 这 从 公式 (4.3.27) 很 容 
易 看 出 , Var(A) 正 是 反映 这 种 保单 组 合 中 非 同 质 性 程度 的 结构 丞 数 的 方 
差 。 下 面 我 们 分 别 讨论 三 种 常见 的 结构 函数 : 
1. 离散 结构 函数 。 假 设 保单 组 合 由 种 不 同 的 风险 水 平 构 成 ， 泊 松 参 
数 A 取 值 于 |A…,A , A， < -… < A,。， 我 们 把 这 种 模型 称 为 “4 元 结构 
模型 ”*。 设 P(A =A) =a,i=0,1,2,…,n， 当 A = A 时 ,保单 的 损失 次 
数 服 从 参数 为 A, 的 泊 松 分 布 ， 则 从 保单 组 合 中 任意 抽取 一 份 保单 ， 其 理赔 
次 数 的 概率 分 布 汕 数 为 : 
P(N = k) = Dy P(N=k|A = A.)P(A = A.) 


A 
= Dake k= .0,12 


通常 使 用 的 是 二 元 结构 模型 ， 即 = 2 。 设 保单 组 合 由 两 类 风险 水 平 
组 成 ， 其 中 低 风 险 〈 泊 松 分 布 参数 A, ) 的 比例 为 a, ， 高 风险 〈 泊 松 分 布 
参数 A, ) 的 比例 为 a, = 1 - a,，， 于 是 ， 

P(N = kk) = a 和 ,A >0,A,>0,k=0,1,2,.… 
k! k! 
(4. 3. 28) 
经 计算 得 到 它 的 均值 、 方 差 和 三 阶 中 心 矩 为 : 
E(N) = alA + CA， 
Var(N) = oA +oA toA +aA (aiA + oA,)’ 
1 = oa -3ma +2m ,oy = oA + oA +3(aA +oA) +aA + oa,A, 

【 例 4-1L1】 某 保单 组 合 中 ， 被 保险 的 汽车 司机 每 年 发 生 事故 次 数 服 
从 泊 松 分 布 ， 假 疫 把 司机 根据 发 生 事故 次 数 的 多 少 分 为 两 类 ， 其 中 驾驶 记 
录 良 好 的 一 类 泊 松 参数 为 0.11， 驾 驶 记录 较 差 的 另 一 类 泊 松 参数 为 2.3， 
如 果 保 单 组 合 中 有 10% 的 司机 行车 记录 较 差 ， 求 任意 一 个 司机 每 年 发 生 2 
次 事故 的 概率 。 

解 : 由 已 知 A，= 0.11, AM， = 2.3,a, =0.9,a =0.1， 那 么 由 式 
(4.3.28) 可 知 司机 发 生 事故 次 数 的 概率 分 布 为 : 


1 k 


入 入 . 
P(N = k) = ai pe + Co a = 0.9 x e”! 2 er 


十 0. 工 X Kl 





因此 ， 
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2 全 
P(N = 2) = 0.9x2 en 2 


+.0. 1 x 71 


= 3.14% 


思 
2. 人 徊 玛 结 构 函 数 。 假 设 个 体 保 单 的 损失 次 数 服 从 泊 松 分 布 ， 其 中 参数 
A 随 保单 不 同 而 不 同 ; 再 假设 A 服从 伽 玛 分 布 ， 参 数 为 (we，6) 。 根 据 定 理 
4 ~4 知 ,NN 服从 负 二 项 分 布 。 
3. 逆 高 斯 结构 函数 。 当 实际 数据 的 尾部 较 厚 时 ， 伽 玛 分 布 作为 结构 函 
数 不 是 特别 理想 。 逆 高 斯 分 布 是 一 个 比较 理想 的 选择 ， 它 的 概率 密度 函 
数 为 : 


uw(A) = (2zpA) Sexp 人 -全 有] ,> 0， B>0,A>0 


保单 组 合 中 任意 一 份 保单 损失 次 数 分 布 为 泊 松 一 道 高 斯 分 布 : 
ps = oxp {- FE +2p)* - 11) 





oD (sp) | 


其 均值 、 方 差 和 偏 度 系 数 y 为 : 
E(N) = 
Var(N) = r(1 +B) 
Y=0 {30 Se 
与 负 二 项 式 分 布 相 比 ， 当 两 者 都 具有 相同 的 均值 和 方差 时 ， 泊 松 - 逆 
高 斯 分 布 的 偏 度 系数 较 大 ， 因 此 它 的 尾部 较 厚 。 


这 类 险种 的 保单 ， 我 们 通常 称 为 相关 性 保单 。 例 如 ， 在 火灾 险 中 ， 一 次 大 
火 可 能 导致 多 户 在 同一 家 保险 公司 投保 火灾 保险 的 家 庭 要 求索 赔 ; 一 次 飞 
机 事故 ， 会 导致 所 有 购买 保险 的 保单 产生 索赔 。 对 于 相关 性 保单 组 合 ， 我 
们 通常 使 用 复合 分 布 来 描述 。 

设 V 表示 保单 组 合 在 单位 时 间 内 发 生 事 故 的 次 数 ， 其 概率 分 布 函 数 为 
P, = P(N = n) ， 概 率 母 函数 为 P,(t) 。M,; 表示 第 i 次 事故 中 产生 的 索赔 
数 ,M, ,i = 1,2,…, 信 为 独立 同 分 布 的 随机 变量 ， 和 且 与 事故 次 数 NN 独立 ，M, 
的 概率 分 布 函 数 为 pP。= P(M, = m) ， 概 率 母 孙 数 为 Pu(i1) ， 那 么 在 单位 时 
间 内 保单 组 合 发 生 的 总 理赔 次 数 为 ; 

S=M+…+M, 

因为 $ 由 随机 变量 M, 与 入 复合 而 成 ， 因 此 称 其 为 复合 随机 变量 。 利 用 独立 
随机 变量 和 的 性 质 ， 可 以 得 到 S 的 概率 分 布 函 数 为 : 
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P(S = 天) 


3 0 


> P(N = n)P(M, + M, t+ + M, = 天) 


= PP (k) 


其 中 , pm"(k) = P(M, + M,+… + M， = 上 ) 称 为 p, 的 n 重 卷 积 。S 的 概率 母 
涵 数 为 : 


P(t) = P(S = k)s = > » PLN Sn Bs =k|N = n)s 
= > DN yy PCM, +M,+:-- +M,=k|IN = rn) 
= Dy P(N = n) POM, t+ M, + + M, = 大) 天 
= by P(N = n) Py smerny. Ct) 
= > P(N = n)[ Pr(t)1" 
= P,(Pr(t)) 

由 命题 4.1 可 以 得 到 $ 的 均值 和 方差 为 : 
E(S) = E(N)E(M) (4. 3. 29) 
Var(S) = E(N)Var(M) + E (M)’Var(N) (4. 3.30) 


【 例 4-12】 某 航 空 公司 每 月 从 城市 A 到 城市 B 的 航线 有 70 个 航班 ， 
假设 每 个 航班 被 取消 的 可 能 性 为 2%， 并 且 每 次 飞行 发 生 事故 的 概率 为 
0. 00001。 已 知 运营 的 飞机 有 200 个 座位 ， 每 次 飞行 乘客 的 就 座 率 为 90% ， 
机 组 人 员 为 6 名 。 假 设 机 上 所 有 人 员 都 购买 了 保险 并 且 飞 机 发 生 事 故 将 致 
所 有 人 员 死 亡 从 而 引起 索赔 。 求 此 航线 每 月 理赔 次 数 的 期 望 和 方差 。 

解 : N 表示 每 个 月 出行 的 航班 数 , N ~ Bl(ni, p),n, = 70,p = 0.98。 

E(N) = np = 68.6 , Var(N) = 70 x 0.98 x 0.02 = 1.372 
已 表示 飞机 上 的 人 员 数 ,M 表示 飞机 乘客 数 ,M ~ B(n,,p),n,， = 200， 
p=0.9, 则 P=6+M 

E(P) =6 +200 x0.9 = 186 

Var(P) = 200 x0.9x0.1 = 18 
令 0 表示 发 生 事故 的 死亡 人 数 ， 则 

E(O) = 0.00186 

E(O’) = 0.00001E(P’) = 0. 34614 

Var(O) = 0.34167 - 0.00186’ = 0. 346137 
令 5S 表示 下 个 月 此 航线 的 理赔 次 数 ， 则 

SO + 0 + + 0; 


。 69- 


“。 70 ， 


E(S) = E(N)E(O) = 68.6 x0.00186 = 0. 1276 
Var(S) = E(N)Var(O0) + E(O)’Var(N) 
= 68.6 x 0.346137 + 0.00186’ x 1. 372 = 23.7450 


4.3.5 免 赔 额 对 理赔 次 数 的 影响 

当 保 单 规定 免 赔 额 时 ， 理 赔 额 不 等 于 损失 人 额 ， 索 赔 的 次 数 也 不 等 于 损 
失 次 数 。 但 是 ， 两 者 又 是 密切 相关 的 。 同 上 节 一 样 ， 我 们 将 在 损失 次 数 的 
基础 上 来 讨论 理赔 次 数 的 分 布 。 设 了 表示 实际 发 生 的 损失 , f(x) 为 其 密度 
英 数 , d 表示 免 赔 额 ,v 表示 保单 发 生 索 赔 的 概率 ， 则 wz = P(X > d) ,了 表示 
理赔 额 ,Y = (X-d)|(X > ad) 。 

令 NN 表示 保单 组 合 单位 时 间 内 发 生 损 失 的 次 数 , 1 = 0 表示 第 j 个 损失 
事故 不 会 引起 赔偿 , 1 = 1 表示 第 7 个 损失 事故 会 引起 赔偿 ,了 = 1,2,…,N， 
则 P(7 = 1) = 。 再 令 N 表示 免 赔 额 为 4 时 的 理赔 次 数 ， 则 

N = 了 + 二 人 (4. 3. 31) 
车 了,-… ,J 相互 独立 ， 且 与 NN 独立， 则 N' 是 一 个 复合 分 布 ， 其 概率 母 函 
数 为 : 

P,.(1) = PL[P,(t)] = Pi[l1 +v(t -1)] (4.3. 32) 
其 中 P(t) = E(t') = aP(T = 0) +2P(T=1)=1-v+ttyv=1+t+v(t -1),。 

【 例 4-13】 假设 某 险种 的 损失 额 服从 帕 累 托 分 布 , a =3，9=1 000， 
免 赔 额 为 250 元 。 假 设 损 失 次 数 服从 奇异 负 二 项 分 布 , r=2，B =3， 求 理 
赔 次 数 的 分 布 。 


解 : 由 已 知 损失 领 厌 的 分 布 函 数 为 P(z) = 1 - (一 000  】 ， 因 此 案 


赔 的 概率 为 v， = P(X > 250) = 0.512 。 由 式 (4.3.32) ， 有 

P(iJ) =11-3[[1+0.5l20 -1)] -1 = [1 -1.536( -1)]” 
所 以 理赔 次 数 服从 奇异 负 二 项 分 布 ， 参 数 分 别 为 2 和 1.536， 这 说 明 保 单 增 
加 免 赔 额 条 款 后 ， 理 赔 次 数 的 均值 由 6 下 降 到 3. 072， 标 准 差 由 4. 899 下 降 
到 2. 7910。 | 三 

类 似 地 ， 我 们 也 可 以 分 析 免 赔 额 提高 后 理赔 次 数 分 布 的 变化 情况 。N' 

表示 把 免 赔 额 提 高 到 d' > d 后 的 理赔 次 数 ， 设 " 表示 在 免 赔 额 提 高 后 ， 以 
前 的 索赔 事件 能 够 继续 获得 赔偿 的 比例 , 则 v= 工 -5 、 令 刀 =1 表 
示 继 续 获 得 赔偿 , 1，= 0 表示 不 能 继续 获得 赔偿 , j = 1,2,…,N ， 
P(1 =1) =v ， 则 

N = 站 +1+… + 
若 假 设 下 ,到 ,…, 必 相互 独立 ， 且 与 N 独立 ， 则 N' 仍 是 复合 分 布 ， 其 概率 


母 画 数 为 : 
Patlt) 三 万 天 5] 
把 P(t) =1+v'(t -1) 代入 式 (4.3.32)， 则 有 
Pi) = Pll +v[l +v(t—-1)-1]] = Pl[l +v'(t—-1)] 
一 下 (cd 
注意 ， 若 免 赔 额 降低 ， 则 ” = > 1 ， 此 时 NW' 的 参数 可 能 超 
出 频率 分 布 的 范围 ， 我 们 不 考虑 这 种 情形 。 
【 例 4-14】 有 承 例 4-13， 在 其 他 条 件 不 变 的 情况 下 ， 若 把 免 赔 额 提 高 
到 300 元 ， 考 虑 理赔 次 数 的 分 布 。 








(1 oy) 
， 1-F(300) \1300) _ 
和 

1 +v’(i—-1)=1 +0.512 x0.8990(:—1) = 0.4552: + 0.5448 
所 以 ， 

Pi, (1) = [1 -3(0.4552 + 0.5448 -1)]2 = [1 -1.3656(: -1)17 
如 理赔 次 数 仍 服从 奇异 负 二 项 分 布 ， 参 数 分 别 为 2 和 1. 3656。 
习题 


1. 假设 某 车 险 实 际 损失 人 额 直 的 分 布 函数 为 
F(x) =1 -0.9e""™” -0.le””™,x 宇 0 

假设 保单 规定 了 保单 限额 为 5 000 元 ， 求 平均 理赔 额 。 

2. 某 班级 的 数学 期 末 考 试 成 绩 服从 期 望 为 0、 标 准 差 为 8 的 正 态 分 布 。 
0 是 一 个 服从 期 望 为 75、 标 准 差 为 6 的 和 正 态 分 布 的 随机 变量 。 数 学 老师 制 
定 了 如 下 的 奖励 规则 : i 如 果 其 数学 考试 成 绩 
高 于 65 分 ， 那 么 这 个 学 生 就 可 获得 奖 学 奖学金 数额 正好 就 是 考试 分 
数 。 考 虑 在 获得 奖学金 的 条 件 下 ， a 

3. 一 个 离散 概率 分 布 有 如 下 性 质 : (1)p; = c(l+1/k)p,,,， k=1, 
2，-…; (2) p。= 0.5。 计算 c。 

4. 某 路 公交 车 到 站 的 数量 服从 每 小 时 20 辆 的 泊 松 分 布 ， 其 中 25% 的 
车 是 快车 ,，75% 的 车 是 慢车 ; 另外 ， 公 交 车 到 站 的 类 型 与 数量 互相 独立 。 
某 人 乘坐 公交 车 上 班 ， 从 车 站 到 工作 单位 ， 快 车 需要 16 分 钟 ， 慢 车 需要 28 
分 钟 。 通 常 他 总 是 乘坐 最 先 到 站 的 任何 一 种 公交 车 ， 而 他 的 同事 则 总 是 乘 
坐 最 先 到 站 的 快车 。 假 设 此 人 和 他 的 同事 在 同一 个 车 站 候车 ， 计 算 在 慢车 
先 到 达 的 情况 下 ， 此 人 比 其 同事 先 到 达 单 位 的 概率 。 

5. 损失 随机 变量 四 服从 混合 分 布 : (1) 80% 的 点 服从 a = 2 ,6 = 100 
的 帕 累 托 分 布 ; (2) 20% 的 点 服从 a =4，,， 69=3000 的 帕 累 托 分 布 。 计 算 
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P(X < 200)。 


天 4 -3 
6. 已 知 某 社区 的 每 个 人 在 














一 年 中 囊 普 通 感 冒 的 次 数 服 从 占 总 人 口 的 比例 | 患 感冒 次 数 的 期 望 值 
Dy LCA py | 
泊 松 分 布 ， 患 感冒 的 次 数 与 个 儿童 0.3 | 3 
体 的 年 龄 和 吸烟 状况 有 关 ， 具 -成 下 丰 归 划 者 06 | ! 
F 0.1 4 
体 数 据 见 表 4 -3。 已 知 菜 人 在 aa 


一 年 里 得 了 3 次 感冒 ， 计 算 他 是 一 个 成 年 吸烟 者 的 条 件 概 率 。 
7. 损失 随机 变量 不 的 分 布 函数 如 下 : 


2 
F(x) = re ， 0O<x<100 


1 ， x > 100 
一 份 保单 约定 每 次 赔付 的 免 赔 额 是 20， 保 单 限额 是 60， 赔 付 比 例 是 80%。 
计算 每 次 赔付 额 的 平均 值 。 

8. 一 个 游戏 的 支付 次 数 和 支付 额度 的 规律 如 下 : 支付 次 数 服 从 每 小 时 
5 次 的 泊 松 分 布 ， 每 次 的 支付 额 可 为 1,2,3,-… 并 且 不 设 上 限 ， 每 次 支付 等 
于 上 的 可 能 性 是 1/2' ， 并 且 每 次 支付 均 独 立 。 计 算 在 给 定 的 20 分 钟 内 没有 
任何 支付 的 概率 。 

9. 某 人 早上 6:15 到 达 火 车 站 ， 根 据 他 的 经 验 ， 火 车 在 7 点 之 前 会 以 每 
半 小 时 1 列车 的 速度 到 站 ; 而 7 点 之 后 ， 则 会 以 每 半 小 时 2 列车 的 速度 到 
站 。 假 设 火车 到 站 的 列 数 服 从 泊 松 分 布 ， 计 算 他 平均 等 待 列 车 的 时 间 。 

10. 某 个 投资 产品 的 相关 信息 如 下 : 

(1) 投资 的 利润 奉 为 当年 证 券 回 报 指 数 的 75% ， 同 时 不 低 于 3% 的 保 
证 利润 率 。 

(2) 年 度 证 券 回 报 指数 服从 期 望 为 8 吧 ， 标 准 差 为 16 锡 的 正 态 分 布 。 

(3) 对 于 一 个 期 望 值 为 人 ， 标 准 差 为 of 的 正 态 随机 变量 对， 给 出 期 望 
值 见 表 4 -4。 

计算 这 个 投资 产品 的 年 平 表 4-4 
均 投 资 收益 率 。 




















EL[X A 3% ] 

11. 一 个 四 口 之 家 ,每 人 每 i a 
年 看 病 的 次 数 服 从 均值 为 1.5 -12% -0.43% 0.31% 
的 几何 分 布 。 每 年 每 个 家 庭 成 -16% _1.99% _1.19% 
员 看 病 的 次 数 相 互 独 立 。 这 个 E[X A 4%] 

家 庭 购买 了 一 份 保险 ， 从 每 人 j= 6% .=8% 
的 第 4 次 看 病 起 ， 这 份 保险 每 ” -12% 0. 15% 0.95% 
次 可 以 支付 100 元 。 计 算 这 个 go =16% -1.43% -0.58% 








家 庭 每 年 得 到 的 平均 赔付 额 。 
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12. 一 个 风险 标的 损失 额 服 从 均值 为 3 的 泊 松 分 布 。 一 份 保单 为 这 个 风 
险 提 供 保 险 保障 ， 约 定 免 赔 额 为 2; 另 一 份 保单 的 赔付 比例 为 a 。 假 设 这 
两 份 保单 的 平均 成 本 相同 ， 计 算 a 。 

13. 某 保险 公司 的 公务 用 车 保单 条 款 如 下 : 

(1) 每 年 的 免 赔 额 为 1 000 元 ; 

(2) 被 保险 人 赔付 (1 000, 6 000) 区 间 内 维修 费用 的 20%; 

(3) 被 保险 人 全 额 支付 6 000 元 以 上 的 维修 费用 ， 直 到 其 总 支付 额 达 
到 10 000 元 ; 

(4) 被 保险 人 每 年 再 支付 剩余 维修 费用 的 10% 。 

假设 汽车 维修 费用 服从 参数 为 6=5 000，aw =2 的 帕 累 托 分 布 。 计 算 每 

年 保险 赔偿 的 期 望 值 。 

14. 随机 变量 六 服从 混合 分 布 : 

(1) 有 p 的 可 能 性 ，N 服 从 g = 0.5,m =2 的 二 项 分 布 。 

(2) 有 1-p 的 可 能 性 ,NN 服从 g = 0.5,m =4 的 二 项 分 布 。 

求 P(N =2) 的 表达 形式 。 


2 i 1 
15. 设 某 责 任 险 实际 损失 额 天 的 分 布 密度 函数 为 f(x) er 


0 到 x 反 200， 保 单 约 定 如 果实 际 损失 额 高 于 S0 ( 百 元 )，, 保险 公司 将 赔偿 损 
失 额 高 于 50 ( 百 元 ) 部 分 的 80% ， 同 时 还 规定 了 保单 限额 为 130 ( 百 元 ) ， 
求 理赔 额 了 的 期 望 ? 

16. 设 A 是 一 个 随机 变量 ,服从 均值 为 1 的 指数 分 布 。 已 知 给 定 人 = 从 
时 ， 理 赔 次 数 N 服 从 参数 为 和 A 的 泊 松 分 布 ,， 计算 P(N = 0)。 


4 
无 区 





17. 对 于 某 险 种 的 理赔 次 数 N， 有 二 = -村 + 


其 中 p, = P(N = 有) ,计算 EC(N) 和 Var(N)。 

18. 设 某 险 种 的 实际 损失 额 有 几 种 可 能 : 25、50、75、100、200、500， 
发 生 的 概率 分 别 为 0.2、0.3、0.2、0.15、0.1、0.05， 假设 损失 次 数 服 从 参 
数 为 r =10、B =0.3 的 奇异 负 二 项 分 布 ， 免 赔 额 为 50， 求 理赔 次 数 的 分 布 。 

19. 健康 保险 中 ， 医生 对 于 控制 病人 的 医疗 费用 起 到 关键 作用 。 某 保 
险 公 司 为 了 控制 医疗 保险 的 赔付 额 ， 打 算 对 医生 实行 一 项 奖励 计划 ， 如 果 
每 张 保 单 的 理赔 额 Y 了 小 于 400 元 ,医生 就 可 以 得 到 奖金 c(400 -了 ) 元。 经 
验 数据 表明 ， 理 赔 额 了 服从 参数 a =2、09=300 的 帕 累 托 分 布 ， 如 果 保险 公 
司 希 望 把 支付 给 医生 的 平均 奖金 额 控制 在 100 元 ，c 应 该 是 多 少 

20. 了 基 是 一 个 属于 (a, 6b6,，0) 分 布 类 的 离散 随机 变量 。 已 知 : (1) P(X 
=0) = P(X =1) = 0.25; (2) P(X =2) = 0.1875 。 计算 P(X = 3)。 

21. 对 于 参数 为 (a, 90) 的 帕 累 托 随机 变量 于 ,证 明 : 在 均值 (了 ) 保 
持 不 变 的 条 件 下 ， 令 aa 一 中 ， 则 帆 累 托 分 布 收 化 到 指数 分 布 。 
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第 五 章 ”短期 个 体 风险 模型 


.学习 目标 ， 

了 解 短期 个 体 模型 的 研究 对 象 以 及 内 容 

了 解 个 体 保 单 理赔 分 布 的 特点 

口 熟悉 研究 保单 组 合理 赔 分 布 的 三 种 方法 : 卷 积 方法 、 和 矩 母 函数 方法 
以 及 近似 方法 

口 掌握 用 正 态 分 布 近 似 总 理赔 模型 的 方法 


| 
口 


$0 引 ，. 而 


假设 保险 人 在 某 个 时 间 段 〈 比 如 一 个 会 计 年 度 ) 内 售 出 了 n 张 保单 ， 
若 被 保险 人 在 此 期 间 发 生 了 保险 合同 规定 的 保险 事故 ， 则 保单 持 有 者 可 以 
根据 保险 合同 中 承保 的 责任 向 保险 人 索赔 ， 保 险 人 则 按 合同 的 承诺 进行 赔 
付 。 对 每 份 保单 而 言 ， 在 这 个 时 间 段 内 发 生 索 赔 与 否 不 确定 ， 赔 付 金 额 大 
小 也 不 确定 ， 要 视 损 失 程 度 与 保险 条 款 而 定 。 假 定 第 i 张 保 单 的 理赔 额 为 
了 ,， 则 7, 为 非 负 随 机 变量 ,进而 ,保险 人 在 这 个 时 间 段 内 的 理赔 或 赔付 总 
量 为 : 


S=X+X+. +X, = SX, (5. 1.1) 
t=1 


一 般 情况 下 ， 要 获得 S 的 准确 分 布 十 分 困难 ， 因 此 我 们 首先 在 一 些 特 
殊 的 假设 下 讨论 S 的 分 布 及 其 性 质 。 假 设 如 下 : 

假设 1: 每 张 保单 是 否 发 生理 赔 以 及 理赔 额 的 大 小 是 相互 独立 的 ， 即 
了 ，X,，…， 半 ,是 独立 的 随机 变量 序列 ; 

假设 2: 每 张 保单 至 多 发 生 一 次 理赔 。 若 用 随机 变量 1 表示 每 张 保单 发 
生理 赔 的 次 数 ， 则 7 的 取 值 为 0 或 1， 即 1 服从 0 -1 分布 或 贝 努 里 分 布 , 记 


做 : 
| 0 1 
Si 
l-g 39 
其 中 ，g 表示 发 生理 赔 的 概率 ， 它 的 确定 要 视 具 体 问 题 而 定 ， 比 如 在 寿险 
中 往往 由 生命 表 确 定 。 


假设 3: 保单 总 数 n 是 事先 确定 的 正 整 数 。 
我 们 称 满足 以 上 3 个 假设 的 式 (5. 1.1) 为 个 体 风险 模型 ， 这 个 模型 以 
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研究 随机 变量 $ 的 分 布 情况 为 主要 内 容 。 

由 于 理论 不 可 能 只 用 一 个 模型 来 概括 全 部 现实 和 和 适应 各 种 类 型 的 实际 
问题 ， 因 此 以 上 假设 都 是 对 实际 情况 的 简化 和 理想 化 。 独 立 性 假设 ! 是 应 
用 大 数 法 则 基本 原理 的 前 提 ， 可 以 看 做 是 最 基本 的 假设 ， 尽 管 它 并 不 概括 
所 有 的 情况 ， 如 水 灾 保 险 和 传染 病 保 险 等 等 ; 假设 2 在 某 些 寿险 和 非 寿 险 
情形 可 能 具有 一 定 的 代表 性 ， 但 显然 不 是 每 种 保单 都 只 人 允许 索赔 一 次 ， 例 
如 汽车 保险 和 健康 保险 就 可 能 会 发 生 多 次 索赔 ; 假设 3 似乎 与 实际 情况 相 
差 甚 远 ， 几 乎 纯粹 是 为 了 数学 处 理 上 的 方便 ， 但 是 也 可 以 把 它们 看 做 是 研 
究 实 际 问题 的 基础 ， 实 际 的 保单 组 合 可 能 包含 一 系列 保单 子 类 ， 而 某 些 保 
单子 类 可 能 近似 符合 假设 3 的 情况 。 在 这 个 模型 中 ， 由 于 保单 数 事先 确定 ， 
因此 也 称 之 为 封闭 模型 。 


$ 5.2 个 体 保单 的 理赔 分 布 


【 例 5-1】 考虑 某 种 一 年 期 的 寿险 保单 组 合 ， 保 单 规定 若 投保 人 在 一 
年 之 内 意外 身亡 ， 保险 人 将 赔付 2 元 ， 若 无 意外 则 不 予 赔付 。 假 设 被 保险 
人 在 一 年 内 意外 死亡 的 概率 为 9， 求 每 份 保单 理赔 额 的 均值 和 方差 ? 


0 b 
解 : 记 XX 为 保险 人 对 第 i 张 保单 的 赔付 额 ， 则 -| E 著 用 FF 
-4 9 


(x) 表示 蕊 的 分 布 函数 ， 则 有 
0 ， x<0 
re eter he O<x<b 
1, Xx 宇 b 
记 了 为 理赔 次 数 ， 则 IT 服从 贝 努 里 分 布 ， 即 
0 1 
i | (5.2.1) 
l1-g ga 
因此 ，X, 又 可 以 表示 为 X, =， 易 知 EL11 =g, Var[1] =gq(1 一 g); 对 于 
XX,， 有 
E[X,] = bg, Var[ X,] =b’g(1 ~ 9g) (5.2.2) 
[ 
【 例 s -2】 对 例 5 -1 中 的 赔付 规则 作 如 下 修改 : 若 保单 持 有 人 在 一 年 保 
险 期 内 困 “ 意 外 ” 身 故 ， 赔 付 额 为 10 万 元 ; 若 因 “ 非 意 外 ”而 身 故 ， 则 赔付 5 
万 元 ; 若 未 发 生 身 故事 件 则 合同 自然 终止 。 根 据 历 史 数 据 记 录 ，“ 意 外 ”种 
“ 非 意外 ” 身 故 的 概率 分 别 为 0.0005 和 0.0020。 这 里 假定 “意外 ” 身 故 和 和 一般 
身 故 的 发 生 是 独立 的 ， 试 重新 讨论 第 i 张 保单 理赔 额 的 概率 分 布 。 
解 : 仍 用 I 表示 理赔 次 数 ，1=1 表示 有 死亡 事故 发 生 需 要 赔付 , T=0 
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则 表示 无 事故 发 生 不 需要 赔付 ; 车 用 B 表示 需要 赔付 的 数额 ，B 已 不 再 是 
常数 ， 而 是 与 /有 关 的 随机 变量 ， 依 题 意 有 : 
Pi7=1,B=100 000} =0.0005, PIT7=1,B=50 000} =0. 0020 
而 且 ， 
gq=PII=1} =P{1=1,B=100 000} +P{1=1,B8B=50 000} =0.0025 
1-g=1-P {I=1} =0.9975 
因此 , 仍 记 X=1B， 其 中 B 的 条 件 分 布 为 : 
p1B=50000|1=1} -2{/=1,B8=50 000| -0.0020 _ 











P{I=1} -0.0025 0 
Pi{I=1,B=100 000| 0.0005 
=1 Es 一- 四 一 二 V。 
P{B=100 000 |7=11 Pri F000:2 


并 且 有 
E[X,] =P{I=0} E[X.|1=0] +P{I=1}E[X,|I=1] 
=(1-g) x0O+gE[BIT=1] 
=g(50 000P{B =50 000 | [=1} +100 000P{B =100 000 | T=1}) 
=150 
Var[ X,] =E(X:) —- [EC(X.)] 
=P{IT=0O}E(X |1=0) +P{IT=1}E(X |1=1) - (EL[X.])’ 
=gE(B’ |1=1) - (EL[X.])’ 
=0.0025 x E(B’|I1=1) -150° 
=0. 0025(50 000’ x0. 8 +100 000’ x0.2) -150’ 
=9 977 500 
一 般 地 ， 若 随机 变量 天 可 表示 为 两 个 随机 变量 7 和 如 的 乘积 : X=1B， 
则 由 
E(X) =E[E(X|7)] 
Var(X) =Var[ E(X|I)] +E[Var(X|7)] 
这 里 1 为 贝 努 里 变量 , 1 与 BB 独立 , 记 gqg=P (1=1)， 因 此 有 
E(X) =gE(B) (5.2.3) 
Var(X) =g(1 -gqg)E’(B) +gVar(B) (5.2.4) 
因此 ， 可 以 利用 式 (5.2.3) 和 (5.2.4) 重新 计算 例 5 -2。 
已 知 : g=P(I=1) =0.0052, P(B=5 000) =4P(B =100 000)， 若 定义 


50 000 为 一 个 货币 单位 ， 则 有 P(B =1) = 人 =1-P(B=2)， 因 此 有 


4 1 _ 6 2、 mv、4 2 1 8 
E(B)=1xF+2x5=5, E(B)=1 x +2 x 二 = 
将 这 些 中 间 结 果 代 入 式 (5.2.3) 和 (5.2.4) 可 以 得 到 与 例 5 -2 同样 的 
结果 。 
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【 例 S-3】 设 有 某 种 汽车 车 辆 险 保单 ， 赔 付 规则 设 定 免 赔 额 为 250 
元 ， 最 高 赔付 额 为 2 000 元 ， 还 假定 在 保险 期 内 至 多 有 一 次 索赔 ， 且 PT= 
1} =0. 15。 由 于 损失 超过 2 250 元 后 最 多 赔付 2 000 元 ， 因 此 对 索赔 额 B 假 
定 : P18=2 000|I=11 =0.1， 而 在 2 000 元 以 下 部 分 的 概率 分 布 函 数 为 ; 


0 ， x<0O 
区 2 
PIB<xIlI=1} = 0.9[1-(1 -F000) | 0O<x <2 000 
1 x 宇 2 000 


斌 讨论 了 的 概率 分 布 。 
解 : 记 理 赔 额 X 的 分 布 函数 为 F(x)， 则 
F(x) =PIX<x! 





=P{lIB<x} 
=PIIB<x|I=01PII=0} +P{IB<x|1=1}1P{I=1} 
0 x0.85 +0 x0.15, x<0 
村 1 人 0 0<x <2 000 
1 x0.85+1 x0.15, x 宇 2 000 
0 ， x<0 
也 
= 0: 985 ~0.135[1 .+3000 ， 0<x <2 000 
1 x 这 2 000 


这 是 一 个 不 连续 的 函数 ， 又 称 “ 混 合 分 布 涌 数 ”， 可 以 看 做 由 离散 和 连续 
的 概率 分 布 混合 而 成 ， 它 在 区 间 0 <x <2 000 上 的 概率 密度 为 : 


f(x) =0.000135 (1- 0 <x <2 000 


i 
0 
而 且 已 (和 =0) =0.85, P( 了 =2 000) =0.013， 所 以 天 的 大 阶 原点 矩 为 : 
E(X:) = [EE + 2 000: x P(X = 2 000) 
0 


由 此 可 以 算出 郑 的 均值 和 方差 分 别 为 : 


2 000 
E(X) = 0. 000135| (1 到 二 CD] dz +2 000 x0.015 = 120 
0 


Var(X)=E(X) - [ECX)]’ 


和 


2 000 > 
三 0. 000135| 用 (1 = 


)}w +2 000’ x0.015 -120* 


=135 600 





$5.3 总 理赔 额 的 分 布 一 一 卷 积 法 


PS WT TO TEPPER ES TTS HE A ANT RE Er I Peto 


在 前 面 讨论 个 体 保单 理赔 分 布 的 基础 上 ， 我 们 开始 考虑 保单 组 合 的 理赔 分 
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布 ， 即 独立 随机 变量 和 $ - 站 X, 的 分 布 ， 本 节 讨论 第 一 种 方法 一 卷 积 方法 。 


5.3.1 两 项 的 卷 积 
【 例 S -4】 相互 独立 的 两 个 离散 随机 变量 X, 和 X,， 其 概率 分 布 分 
别 为 : 
0 1 2 :… mm 0 1 2 2 nn 
| 
po Pi P: Pa 
试 求 S = 外, + 站, 的 分 布 。 
解 : S=X,+X, 的 可 能 取 值 为 {0，1，…， m+n} ; 对 应 的 概率 为 : 
PIS=k} = PIX +X, = &k| 
= Pi(X, =0,X, =k)U(X =1,%, = ko-1) U(X = Ek, xX, =0)! 


do qd **” 4, 


= DPIX =i XK =k-il = DPIX =iPlX =k-ii 


天 
= Pb 
520 


或 者 PIS=k| = PIX, +X, = k} 
= PI(X =k,X, =0) U(X =k-1,k, =1)U-…(K =0,%, = £)| 


k 
= > Pr 加 
i230 


【 例 5-s】 相互 独立 的 两 个 非 负 连续 索赔 额 随机 变量 X 和 X,， 设 联 
合 概率 密度 和 边际 密度 分 别 为 /x,y) 、f,(x) 和 f(y)， 试 求 S$ =X,+X, 的 概 
率 密度 。 | 
解 : 由 独立 性 知 f(x, y) =f/.(x)f,(y)， 设 5 的 分 布 函数 和 密度 分 别 为 
F,(z) 和 f(z)， 由 定义 有 : 
F(z) = PIX, + X, < 2z} 


ll 


[fxs7) dxrdy = | ff Cy) drdy 


AVE fadylar = Jo -«) dylax 


= [fC -dx]ldy 
所 以 ，S =X，+X, 的 分 布 密度 为 : 


fs) = {f(z -人 ax (5. 3. 1) 

或 者 
f(z) = [fz -fy) dy (5. 3.2) 
式 (5. 3.2) 称 为 卷 积 公式 ， 记 为 (2) = 请 * 户 (z) 。 
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【 例 5-6】 设 X 在 [0,100] 上 均匀 分 布 ,，Y 在 [0,150] 上 均匀 分 布 ,XX 
与 了 相互 独立 ， 令 3S = 和 + 了 Y， 试 计算 /,(175)。 


解 : 由 式 (5.3.1) ,上 (175) = | fC -x)dx 。 叉 由 政和 Y 分 
布 的 定义 ， 有 


0 ， x<0 0 ， y<0 
1 1 
= 4 一 一 - < 委 X 反 = 4 一 -~-， 0 三 y 和 1S0 
fi(x) 100， 0<x<100 fl(7) 150， 7Y 志 
0 ， x>100 0 ， y>150 


因此 有 
f.(175) = AA — wx) dx 


1 1 1 
2 i 
io0 * To0 < 00 2 S00 


5.3.2 多 项 卷 积 
【( 例 S-7】 设 半 ， 肝 ,，…-， 了 ,为 相互 独立 的 个 离散 随机 变量 (n> 
2) ， 并 设 蕊 的 概率 函数 为 p,(z) ,i =1,2,…,n。 试 求 多 项 和 S = 居士 下 十 
+ 芭 , 的 概率 分 布 函 数 。 
解 : 利用 卷 积 方法 求 多 个 独立 随机 变量 和 的 分 布 ， 可 以 在 两 项 卷 积 
的 基础 上 通过 逐次 迭代 来 实现 ， 比 如 要 求 S = 义 , + 半 , + 头 , 的 分 布 ， 可 以 先 
对 承 , 和 XX, 进行 卷 积 ,然后 再 将 站， + XX, 和 XX, 进 行 卷 积 运算 ， 如 此 迭代 
下 趟 5 
对 于 1 <k<n， 记 义 , + +… + 六 ,的 概率 函数 为 p"*“(z)， 则 有 
pz)=p°™ *pi,(z) 本 
1 2 3 
【 例 5 一 8】 设 随机 变量 忒 ， 天 和 总 相互 独立 ， 且 闷 一 | )， 
05 04 01 
试 求 S = 下 + + 久 , 的 概率 分 布 。 


i 1 2 3 
i 2 -PC = [0s 0.4 | 


oe es 2 3 4 5 6 、， 
+ 一 %) 二 沙 %X)= 
a 人 蒜 25 0.4 0.26 0.08 0. 


及 十 居士 大 3 = (X, + 了 X,) 十 及 3 ~p" (x) =p1 *p * pi(%) 


(0.5 0.4 0.1 0.25 0.4 0.26 0.08 0.01 
具体 计算 结果 如 表 5 -1 所 示 。 


1 2 3 2 3 4 5 6 
加 


0 
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f(z) =P (2z) 





















































国 
【 例 S-9】 设 随 机 变量 X ，X, 和 半 相 互 独立 ， 其 概率 分 布依 次 如 下 : 
0 1 2 3 0 1 2 3 4 
0.4 0.3 0.2 oa zs 0.2 0.1 0.1 0.1)’ 
0 2 3 4 5 
0 0.1 0.1 0.1 i 
试 求 S = 和 +X + 的 概率 分 布 。 
解 : 由 两 项 和 卷 积 公式 (5.3.1)， 有 : 


本 


0 1 2 3 4 5 6 7 
大 | 十 于 ,~ 
0.2 0.23 0.2 0.16 0.11 0.06 0.03 0.01 
运用 和 迭代 方法 有 : 
,二 + 于 ， 十 下， = (不 | 十 天 ) + ~p' (2) = 万 "2 * ps(z) 
S| 0 1 2 3 4 第 6 邓 8 9 10 11 12 ) 


0.12 0.138 0.14 0.139 0.129 0.115 0.088 0.059 0.036 0.021 0.01 0.004 0.001 


计算 结果 综合 列 人 表 5 -2。 


表 5 -2 例 5 -9 的 计算 过 程 
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F' 0)(z) 








5 0.0 0.96 0. 115 0.781 

6 0.0 0.99 0. 088 0.868 

7 0.0 1.00 0. 059 0.928 

8 0.0 1.00 0. 036 0. 964 

9 0.0 1.00 0.021 0. 985 

10 0.0 1.00 0.010 0.995 
1.00 





同样 ， 也 可 以 计算 多 个 连续 的 独立 随机 变量 和 的 概率 分 布 渔 数 和 密度 
六 数 。 

【 例 S-10】 设 X，X,，…， ,为 相互 独立 且 同 分 布 的 nz 个 连续 随机 
变量 (n >2)， 试 求 多 项 和 S$ =X + XX + -… + 的 概率 分 布 孙 数 和 概率 
密度 。 

解 : 设 XX 的 分 布防 数 为 f(x) ， 分 布 密度 为 Kxz)，5=1，2，…，Pm， 则 
S 的 概率 分 布 函 数 ECxz) 和 概率 密度 ACxz) 分 别 为 : 

F(x) = 下 (xx) = 天  * F(x) 
fx) = 广 (x) = 三" # f(x) 
其 中 : F*'(z)=F(z), f°'(z) =f(z) 
因此 ,F(z) =F*F(z) =PIX,+X,<z) ,f(z) =f*f(z)， 依 此 类 推 。 昌 


$5.4 总 理 周 额 的 分 布 一 您 母 函 数 法 


卷 积 方法 计算 理赔 变量 的 精确 分 布 往往 需要 进行 大 量 的 计算 。 而 对 于 
取 值 非 负 的 随机 变量 XX， 由 和 矩 母 洋 数 的 定义 4.1 可 知 概率 分 布 函 数 下 (x)， 
x 宇 0 与 函数 M，(1) ,i 宇 0 是 一 一 对 应 的 ， 互 相 决 定 。 

由 矩 母 函数 的 性 质 3 我 们 还 可 以 知道 ， 独 立 随 机 变量 和 的 和 矩 母 函数 与 
各 随机 变量 矩 母 函数 之 间 的 关系 ， 即 : 对 于 独立 随机 变量 和 S = XX + + 
六 二 及, ， 有 


M(t) = M (2) :M(t) (5.4.1) 
车 XX, ，X,，…，X, 独立 同 分 布 ， 设 其 共同 的 和 矩 母 注 数 为 用 .(:) ， 则 
Ms(i) = [M(t) 1", t 宇 0 (5. 4.2) 


根据 和 矩 母 函数 的 性 质 (5.4.1) 和 “(5.4.2)， 往 往 可 以 比较 容易 地 获 


. 81. 


. 82. 


得 保单 组 合理 赔 分 布 的 矩 母 冰 数 ， 然 后 利用 和 抢 母 画 数 与 分 布 一 一 对 应 的 性 
质 获得 总 理赔 的 分 布 函 数 。 例 如 ， 第 四 章 的 定理 4 -2 就 说 明了 独立 的 泊 松 
随机 变量 之 和 仍然 服从 泊 松 分 布 ， 并 且 参 数 为 相应 的 各 参数 之 和 。 事 实 上 ， 
服从 负 二 项 分 布 的 随机 变量 也 具有 类 似 的 性 质 。 

定理 5-1 设 针 ,XX,，…,《 外 ,为 相互 独立 的 随机 变量 ,X, 服 从 参数 为 


(r;，P) 的 负 二 项 分 布 ， 则 S = 和 + 处 ,+… + 外 .服从 参数 为 ( > r:，P) 的 负 
二 项 分 布 。 
证 明 : 由 第 四 章 对 负 二 项 分 布 的 介绍 ， 可 知 X, 的 概率 母 隐 数 为 : 








/Pp \" 1 
P(t) = (7a) Os 
因 些 矩 母 函 数 为 : 
CAS 0<i< -nd 


所 以 根据 式 (5. 4. 1) ，S 的 矩 母 函数 为 : 


T, 


Ms(t) = 1 mM) = 1 G eo = ( 2 二 








再 次 对 照 负 二 项 分 布 的 矩 母 函 数 可 知 ，$ 服从 参数 为 ( 六 rn ，p) 的 负 二 项 
分 布 。 
同 理 可 证 + 个 独立 同 分 布 的 参数 为 p 的 几何 分 布 之 和 服从 参数 为 (7,p) 


的 负 二 项 分 布 。 而 
对 于 连续 随机 变量 ,我 们 在 第 四 章 也 有 如 下 结果 : 如 果 不 ，…， 世 .是 独立 


的 且 服 从 参数 为 (as ,6) 的 伽 玛 分 布 随机 变量 ， 则 了 -= 允 多 服从 参数 为 (a， 
6) 的 伽 玛 分 布 。 特 别 地 ， 若 XX，…， 太 是 独立 且 同 服从 参数 为 6 的 指数 分 布 ， 
则 Y= 避 和 服从 参数 为 (n，9) 的 伽 玛 分 布 ， 这 说 明 在 固定 尺度 参数 9 的 条 件 


下 ， 伽 玛 分 布 具有 可 可 性 ， 事 实 上 ， 正 态 分 布 也 具有 可 加 性 。 
定理 S-2 设 扎 大,… 芝 为 相互 独立 的 随机 变量 ,站 ~ 和 N (CNA， 


ao ,zi=1，2,…)， 则 5S= 大 十 第 十 .… 十 大 ~N( Pr, > Cj。 


证 明 : 由 第 四 章 正 态 分 布 的 抢 母 画 数 以 及 式 (5.4.2) 知 5 的 和 矩 母 函 
数 为 : 


M(t) = [TIM,Ct) = Te”*? = eB 
i=l t=1 


对 照 正 态 分布 的 答 母 函数 可 知 ，5 服从 参数 为 ( (Pr, yo ) 的 正 态 分 布 。 
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定理 5 -1 和 5-2 表 明 这 些 分 布 族 对 于 独立 和 的 运算 是 封闭 的 ， 即 分 
布 族 中 的 独立 随机 变量 和 的 分 布 仍然 属于 该 分 布 族 。 如 果 将 这 个 性 质 用 于 
个 体 风险 模型 ， 也 就 是 个 体 理 赔 的 分 布 与 总 理赔 的 分 布 属于 同一 个 分 布 族 。 


35.5 总 理赔 额 分 布 的 正 态 近 似 


卷 积 方法 和 和 矩 母 函数 法 都 可 以 获得 独立 随机 变量 和 的 精确 分 布 ， 但 对 
于 保单 数 较 多 的 保单 组 合 来 说 ， 更 实用 的 方法 则 是 考虑 组 合理 赔 量 的 近似 
分 布 。 

从 概率 论 的 中 心 极 限定 理 知 ， 在 一 定 的 条 件 下 ， 当 变量 的 个 数 趋向 无 
独立 随机 变量 和 的 分 布 将 趋 于 正 态 分 布 。 中 心 极 限定 理 的 具体 表 
为 : 

中 心 极 限定 理 设 半 ，X,,… ,XX, 为 独立 同 分 布 的 随机 变量 序列 ， 并 上 且 
E(X,) = 人 < o ,Var(X)=o <%m。 则 S=X + 六 ,+… + 六 ,的 分 布 将 趋向 于 





党 





S—-E(S) 
正 态 分 布 ， 即 《“。= = (所 ) 满足 
war(S) > “A 


limP(Z¢, < x) = B(x) = (5.5.1) 


=| edt 
MWZQTT--= 

中 心 极 限定 理 中 的 同 分布 条 件 并 不 是 必要 条 件 ， 一般 地 ， 设 XX ，X,， 
， 了 六 :,，… 为 独立 随机 变量 系列 ， 设 XX 的 分 布 旺 数 为 F(x),， 且 E(X,) = 





n X a 
jyVar(X4) = 加 , 记 民 =- 了 at = 允 人 和 全 则 式 (5.5.1) 成 立 的 更 
为 一 般 的 充分 条 件 是 如 下 的 林 德 贝 格 条 件 : 


jin oC pe) dFil%) =0 对 任意 e >0 (5.5.2) 


因为 风险 理论 主要 是 应 用 中 心 极限 定理 ， 所 以 ， 这 里 我 们 略 去 了 有 关 
的 证 明 ， 请 读者 自行 参阅 有 关 的 文献 。 

有 了 上 面 的 定理 ， 我 们 可 以 用 来 计算 保单 数 很 多 的 保单 组 合 的 总 理赔 
分 布 。 基 本 的 计算 步骤 是 : 


第 一 ， 利 用 个 体 理赔 的 分 布 计算 总 理赔 5 的 均值 BE(S) = 对 EE(X,) 和 


方差 yar(S) = > Var( ¥,); 


第 二 ， 对 5 的 分 布 计 算 进 行 标准 化 处 理 : 
S—-E(S) -ss-E(S) 
ry VVar(S) 
第 三 ， 利 用 中 心 极限 定理 近似 计算 : 





P(S<s) =P| 


.83 . 


精算 模型 


.84. 


OP .EAS Sk 
VVar(S) 

因为 进行 理赔 分 析 的 目的 之 一 是 确定 保费 ， 所 以 通常 会 考虑 s 为 总 理 
赔 5 的 均值 的 某 个 倍数 ， 例如 ，s = (1+6) 五 (S)， 这 时 称 9E5(5S) 为 该 保单 
组 合 的 安全 附加 保费 ， 称 9 为 相对 附加 安全 系数 (或 安全 附加 保费 率 )。 

【 例 5-11】 考虑 由 10 万 张 同 类 医疗 保险 保单 构成 的 组 合 。 假 设 承保 
的 损失 相互 独立 ， 按 照 保单 的 规定 ， 保 险 人 将 负责 赔付 所 发 生 损 失 的 80% 。 
设 每 张 保单 在 保险 期 内 的 损失 均 服 从 如 表 5 -3 所 示 的 分 布 。 若 要 求 收 取 的 
保费 总 额 低 于 理赔 总 额 的 概率 不 超过 5% ， 试 确定 该 保单 组 合 最 低 的 安全 附 
加 保费 。 


表 5 -3 个 体 保单 的 损失 分 布 











解 : 经 计算 ， 有 
E(X) =1 325 ， Var(X) =8 498 625 
设 总 损失 变量 为 : 
100 000 
也 = 下 ， 
则 | E(L) =1 325 x 100 000 ， Var(L) =8 498 625 x 100 000 
理赔 总 额 变 量 为 : 


100 000 


S=0.8L=0.8 XxX, 
则 E(S) =0.8 xl 325 x100 000 =1 060 x 100 000 

Var(S) =0. 8 x 8 498 625 x 100 000 =5 439 120 x 100 000 
又 设 保费 总 额 为 : 

G=(1+0)E(S) 
按 题 意 要 求 ，G 应 该 满足 : 

P{S<(1+0)E(S)} 95% 


也 就 是 说 ， 
s-E(S)\ 1 _ 9E(S) 
s=(14+0)E(S) = ?| | | Ts | 
二 OE(S) OE(S) 
若 四 (一 一 ) =0.95， 则 有 一 一 =1.645， 则 该 保单 组 合 的 安 
VVartsy) VVertsy 的 
全 附加 保费 为 : 





8E(S)=1.645 x V5 439 120 x 100 000 =1 213 193. 9 
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2 1213193.9 
相对 附加 安全 系数 9 为 : 6=- 060 x100 000 ~ 1 


【 例 5.12】 设 某 保险 公司 共 售 出 某 种 汽车 保单 2 500 张 ， 保 单 持 有 者 
被 分 作 两 类 ， 情 况 如 表 5 -4 所 示 。 其 中 ， 理 赔 额 B, 服从 参数 为 ( 和 A,， 工 ) 
的 截断 指数 分 布 ， 分 布 密度 郴 数 为 : 














0 ， xs<0 表 S-4 保单 持 有 者 风险 状况 
f(x) =lAe”, O<x<L 理赔 额 B, 的 分 布 参 数 
2 类 型 上 | 人数 n， 理赔 概率 9k 
ee ，, eb 
(5.5.3) 
若 要 求 收 取 的 保费 总 额 低 于 








理赔 总 额 的 概率 不 超过 5% ， 试 
计算 安全 附加 保费 率 6。 

解 : 与 例 5 -11 类 似 ， 用 5 表示 理赔 总 量 ,， 要 计算 概率 不 等 式 P1S=< 
(1+0)E(S)}) 宇 95% 中 的 9。 

根据 正 态 近似 ， 同 样 有 


9 =1.645 x MY) 


Ef] (5. 5.4) 


因此 ， 关 键 是 计算 BC(S) 和 Yar(S)。 记 S= DX,= D1B,= 1B,+ >》71Bi， 
其 中 8, 和 8 分 别 对 应 两 种 不 同情 况 下 的 理赔 额 。 对 于 参数 为 (A,，L) 的 截 
断 指数 分 布 B， 有 
1 —e™* 

入 9》 





L 
E(B) = {xAe dx + Le = 
0 


Var(B) 


lt 


E[B’] - (E[B])’ 
= =。 “dx +Le”— (一 一 ) 
T 一 2AZLe Ms Pg 
0 
再 分 别 用 (A, ZL) = (1, 2.5) 和 (A, L) = (2, 5) 代 人 上 式 得 : 
E(B,) =0.9179 ,Var(B,) =0. 5828,i=1,2,..…,500 
E(B,) =0.5,Var(B,) =0.2498 ,j =501 ,502 ,…,2 500 
从 而 有 : 
(1) 当 z=1，2，…，500 时 ， 
E(X,) = E(1B.) =E(E[LB,|1]) =g.E(B,|1=1) =0.09179 
Var(X,) = Var(1.B,) = Var(E[B,|1]) +E[Var(B,|l1.=1)] 
=(E[B|L=1])’g(l-g) +qVar(B,|1=1) =0. 13411 
(2) 类 似 地 ， 当 j=501，502，…，2 500 时 ， 


.85- 


. 86: 


E(X,) =0.025,Var(X,) =0.02436 
从 而 有 : 
E(S) =500 x0.09179 +2 000 x0.025 =95. 90 
Var( S) =500 x0. 13411 +2 000 x0. 02436 =115. 78 
因此 ,9 =1. 645 x EP = 1. 645 x =0. 1846 
元 
【 例 S-13】 茶 团 体 医疗 保险 业务 的 理赔 数据 如 天 5 -5 所 示 (以 年 为 
时 间 单 位 )。 
试 计 算 理 赔 总 额 超过 18 万 元 的 概 表 5 -5 个 体 理 赔 额 经 验 数据 
率 (用 正 态 近似 )。 
解 : 用 S 表示 理赔 总 额 ， 则 
E(S) =786 x76 + 592 x 187 






个 体 理赔 额 (单位: 元 ) 





保单 类 型 | 投保 人 数 





= 170 440 家 庭 592 187 77 
Var(S) =786 x42’ +592 x77’ 
=2 212. 8’ 





因此 ， 
S -170 440 、180 000 -170 440 
V2212.8) V2 212.8)” 
=7.80 x10™ 

【 例 S5-14】 某 公 司 为 其 14 名 员工 购买 了 “一 年 期 团体 定期 寿险 ”， 
每 位 员工 的 给 付 额 根据 工资 水 平 确定 ,死亡 率 以 中 国人 寿 保险 业经 验 生 命 
表 CL00 -03 为 准 ( 见 表 5 -6)。 斌 按照 精确 计算 和 正 态 近似 的 方法 计算 理 
赔 总 额 超过 5 万 元 的 概率 ， 比 较 两 个 结果 的 差异 并 分 析 原 因 。 


P(S >180 000) =P ] =1 - $B(4.32) 


表 5 -6 承保 员工 的 相关 数据 












死亡 率 9 死亡 率 gq 
























1 20 F 1 . 000283 8 . 000795 
2 21 M 2 -000661 9 . 000815 
3 22 M 3 .000692 10 - 000842 











4 23 .000328 11 .000406 














.000738 . 000932 






.000347 . 000465 











.000779 . 001055 
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解 : 首先 考虑 P(S >5) 的 精确 值 。 记 5 的 概率 分 布 函 数 为 p;(x)， 由 


于 S= > X, ， 所 以 有 ps(x) SP Pr 汶 * pris(%), 其 中 ， 


p;» x=0 
px (x) -| 3 7=1,2， ,14 
4dj， 区 三 b, 
车 记 S =S ,+ 和 ,j=2,，3，…，14， 则 5 的 概率 函数 可 以 通过 和 迭代 的 卷 积 
计算 得 到 。 
从 5, = 已 开始 ， 得 : 
Pips 《2x) ? 乞 < 已 
Pua) =| ， 了 =2,3，…，14 
Pips (ZX) +Ps (x—b,)g,, Xb, 


关于 5, 和 5, 的 详细 结果 如 下 : 
ps (0) =0.999717, 


Pps.(0) =p, xfs (0) =0. 999056, 


Pps,(2) =g, xps (0) =0. 00661 ， 
依 此 继续 ， 可 得 p;(x) 的 值 ， 表 5 -7 给 出 了 F(x) 的 值 。 


ps (1) =0. 000283 
ps.(1) =p, xps (1) =0. 000283 
ps(3) =g, xps (1) =1.87 x107 






































表 S-7 通过 和 迭代 方法 计算 得 到 的 (x) 的 精确 值 
x 0 1 2 3 4 5 6 7 
Fs(zx) | 0. 9909 0.9909 0.9916 0.9922 0. 9926 0. 9933 | 0. 9936 0. 9944 
x 8 9 10 11 12 13 | 14 15 
Fs(x) | 0.9952 0. 9960 0. 9973 0. 9973 0. 9973 0. 9973 | 0. 9973 0. 9989 
因此 有 : 
F.(S5) =0.9933 ,1 —-F,.(5) =0. 0067 
其 次 考虑 P(S >5) 的 近似 值 ， 因 为 
14 
E(S) = > = 0. 084 
14 14 14 
Var(S) = 5 gb - qb = Yq -gq)b; = 1.06061 = (1.02989)" 
j=1 j=1 j=1 





按照 正 态 近似 ， 
P(S>5)=1-P(S<5) 
-1_ Pp(S—0.08445 5 -0. 08445 ) 
和 1. 02986 “1.02986 


=1 -中 (4.77303) =9.07x107™ 


比较 两 种 方法 的 结果 ， 显 然 ，0. 0067 比 9.6 x 10 大 很 多 。 
产生 这 一 偏差 的 主要 原因 是 ，S 的 分 布 不 是 像 正 态 分 布 那 样 的 对 称 分 


布 ， 而 是 有 偏 分 布 ， 经 计算 其 偏 度 为 由 (请 ) 了 =12.55， 非常 大 ， 因 此 用 


。87 . 


。88 ， 


正 态 分 布 来 近似 并 不 恰当 。 

一 般 来 说 ， 只 有 当 样 本 量 半 非常 大 时 ， 才 适合 用 正 态 分 布 来 近似 其 总 
分 布 ， 这 个 题目 的 样本 量 只 有 14 ， 显 然 过 小 ， 因 此 使 用 正 态 分 布 近 似 是 不 
合适 的 。 天 


对 是 


1. 假设 时 是 连续 扔 5 次 硬币 后 “国徽 ” 面 朝 上 的 次 数 ， 然 后 再 一 起 扔 
总 个 朋 子 。 设 了 是 直人 个 鹏 子 的 数目 总 和 ， 试 求 了 的 均值 和 方差 。 

2. 某 建筑 物 的 价值 为 w， 在 一 定时 期 内 发 生火 灾 的 概率 为 0.02。 火 灾 
发 生 后 ， 建 筑 物 的 损失 额 服从 0 到 a 的 均匀 分 布 。 试 计算 在 该 时 期 内 损失 
额 的 均值 和 方差 。 

3. 和 XX, 是 两 个 独立 随机 变量 ， 取 值 都 是 非 负 整 数 。S =X， + 处 ,。 已 
知 表 5 一 8， 计算 f(1)。 

4. 中 ,ii=1，2， 3 是 独立 同 分 布 的 随机 变 
量 ， 共 同 的 分 布 函数 为 : 


表 5 -8 





0, x<0 
F(x) =lx, O<x<l1 
1, zx 宇 1 





记 S = 针 , + 四, + 蚊 。 要 求 : 
(1) 证 明 S 的 分 布 溪 数 为 : 


0 ， x<0 
和 O<x<1 

Pes [xz -3(x-1)’]/6, 1<x<2 
[x ~3(x—-1)’ +3(x-2)’]/6, 2<x<3 
1 ， ZX 三 3 


(2) 计算 E(S) 和 Var(S); 

(3) 用 (1) 中 的 分 布 通 数 计 算 下 列 概率 : (i) P(S<0.5) ;(z2) P(S 
<1.0)。 

5， 如 果 变 量 钱 的 概率 分 布 如 表 5 -9 所 示 。 记 S=XX +X,+XX，， 其 中 X， 
是 相互 独立 且 与 下 同 分 布 的 随机 变量 ,分 别 用 卷 积 和 和 天 母 泥 数 的 方法 求 5 
的 概率 分 布 并 确定 其 期 望 值 。 

6. 3S= 咒 + 天 上 -十 和 大， ii=1，2，…，6 是 服从 如 玛 分 布 的 独立 同 
分 布 随机 变量 。E(X,) = Var(X,) =i,i=1, 2, -…, 6。 计算 E[S ]。 

7. 随机 变量 加 的 答 母 涵 数 为 : 
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Mi = (1 -2:1)™, 0 <s< 方 


(1) 用 纸 母 函数 计算 芝 的 均值 和 
方差 。 

(2) 用 正 态 函数 近似 计算 yow 和 
yo1， 其 中 YY. 为 满足 P(U>Yy.) =e 的 解 。 

(3) 根据 你 所 掌握 的 分 布 函 数 和 短 母子 数 的 人 信息， 确定 了 的 分 布 函 数 
并 重新 计算 yo 和 yooe 





8. 若 P[ YX =n +aVno] =c+6b 四 (d)， 其 中 a 为 已 知 参数 ， 利 用 


中 心 极限 定理 求 6, c 和 d。 其 中 头 是 独立 同 分 布 的 随机 变量 ,J 和 er 分 别 
为 均值 和 标准 盖 。 四 是 标准 正 态 分 布 的 分 布 函 数 。 再 利用 该 近似 式 计 算 本 
习题 第 4 题 中 的 (3 ) 。 

9. 某 火 灾 保 险 公 司 承 包 了 160 由 建筑 物 的 火灾 保险 ， 其 保险 金额 如 表 





5 一 10 所 示 。 表 5 -10 

假设 每 尽 建 筑 物 一 年 内 最 多 只 发 生 一 次 一 全 从 机 ”| 保险 他 同 数 
火灾 ， 概 率 为 0.04， 再 设 每 幢 建 筑 物 的 损失 10 000 80 
变量 相互 独立 ,发 生 损 失 时 的 损失 人 额 服从 0 20 000 35 
到 最 高 保险 金额 之 间 的 均匀 分 布 。 记 NN 为 一 30 000 25 
年 内 保险 人 的 总 赔款 次 数 ，S 为 总 赔款 额 。 50 000 15 
要 求 : 100 000 5 





(1) 计算 NN 的 均值 和 方差 ; 

(2) 计算 5S 的 均值 和 方差 ; 

(3) 如 果 保 险 人 要 使 承保 后 总 赔款 额 超过 所 收 保 费 的 概率 不 超过 19% ， 
计算 安全 附加 费 率 。( 用 正 态 分 布 近似 ) 

10. 某 寿 险 公 司 向 2 300 名 客户 售 出 一 年 期 短期 寿险 合同 ， 如 表 5 一 11 
所 示 。 该 寿险 公司 作为 直接 保险 人 ， 决 定 将 每 份 保 单 超过 1 的 损失 进行 再 
保险 。 若 再 保险 人 希望 收集 足够 的 保费 满足 实际 损失 额 超 过 再 保费 总 额 的 
概率 不 超过 5% ， 试 确定 再 保险 人 的 安全 附加 费 率 。 


表 5 -11 
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第 六 章 ”短期 聚合 风险 模型 


-学 习 目 标 
口 了解 短 期 聚合 风险 模型 的 内 涵 以 及 它 与 短期 个 体 凤 险 模 型 的 区 别 和 
口 了 解 理赔 总 量 模 型 特别 是 复合 激 松 模型 的 基本 性 质 与 特殊 性 质 
口 了 解 聚 合理 赔 量 的 两 个 近似 模型 
口 熟悉 复合 泊 松 模型 的 各 种 性 质 
口 掌握 并 能 运用 上 述 性 质 解 决 实 际 问题 


86.1 引 言 


第 五 章 中 讨论 的 个 体 风 险 模型 是 以 每 张 保 单 为 基本 对 象 ， 考 虑 保单 组 
合 在 一 定时 期 内 发 生 的 理赔 总 量 ， 进 而 考虑 公司 的 所 有 保单 组 合 在 某 段 时 
期 的 理赔 总 量 。 但 是 ， 在 保单 组 合 给 定 的 保险 期 间 内 ， 大 多 数 保单 是 不 会 
发 生理 赔 的 。 因 此 ， 可 以 将 保单 组 合 中 的 保单 按照 是 否 发 生理 赔 分 为 两 类 ， 
其 中 不 发 生理 赔 的 保单 不 影响 保单 组 合 的 总 损失 金额 。 本 章 介 绍 的 聚合 风 
险 模 型 是 将 保单 组 合 视 为 一 个 整体 ， 以 发 生理 赔 的 保单 为 基本 研究 对 象 ， 
理赔 总 量 蚌 按 每 次 理赔 发 生 的 时 间 上 大 序 将 所 有 理赔 量 囚 加 起 来 。 

用 N 表示 某 类 保单 在 单位 时 间 (比如 一 个 会 计 年 度 ) 内 发 生理 赔 的 次 
数 ， 用 C, 来 表示 该 类 保单 在 此 期 间 第 i 次 理赔 的 金额 ， 则 该 类 保单 在 此 期 
间 的 理赔 总 量 $ 可 表示 为 : 


| N>0 se 
0 N=0 
其 中 : 

1. WN 取 值 为 非 负 整数 ,而 且 P{N=0} >0, NWN 是 与 保单 组 合 的 理赔 发 
生 频 率 有 关 的 随机 变量 ， 一 般 称 之 为 理赔 次 数 变量 ; 

2. C, 是 取 值 于 正 数 (连续 或 离散 )、 测 量 每 次 独立 理赔 量 额度 大 小 的 
随机 变量 ,而 且 有 P{C;=01 =0, 一 般 称 之 为 理赔 额 变量 。 

为 了 使 模型 (6. 1.1) 在 理论 上 具有 可 操作 性 ,通常 对 其 有 以 下 的 
假设 : 

假设 1 随机 变量 N，C,，C,，… 相 互 独立 。 


假设 2 C,，C… 具 有 相同 的 分 布 ， 即 C; 都 是 同 质 风险 。 记 它们 的 共 
同 的 概率 分 布 函 数 为 P(x) 、 概 率 密度 (或 概率 函数 ) 为 p(x)， 用 C 表示 
服从 该 共同 分 布 的 随机 变量 。 

独立 性 假设 1 是 较为 普遍 的 假设 ， 是 对 实际 问题 的 简化 ， 关 于 理赔 额 
同 分 布 的 假设 显然 只 适用 于 具有 辐 质 风险 的 同类 保单 。 至 此 ， 已 完成 对 模 
型 (6. 1.1) 的 基本 说 明 ， 在 风险 理论 中 一 般 称 模型 (6. 1.1) 为 短期 聚合 
风险 模型 ， 按 照 概 率 论 的 定义 ， 也 称 模 型 (6. 1.1) 为 复合 模型 或 随机 和 
变量 。 

对 于 模型 (6. 1. 1) 我 们 主要 关心 的 是 聚合 理赔 量 5S 的 分 布 ， 也 就 是 研 
究 如 何 用 六 的 分 布 和 C: 的 分 布 来 表示 S 的 分 布 ， 所 以 首先 要 分 析 NN 和 C; 的 
分 布 。 对 于 N， 通 常会 选择 二 项 分 布 、 泊 松 分 布 和 人 负 二 项 分 布 等 离散 型 分 
布 ; 对 于 C;,， 通 常 考虑 指数 分 布 、 对 数 正 态 分 布 和 伽 玛 分 布 等 取 值 于 正 半 
实 轴 的 连续 分 布 。 

如 果 用 泊 松 分 布 来 描述 理赔 次 数 NN 的 分 布 ， 则 模型 $ 称 为 复合 泊 松 分 
布 ， 它 在 风险 理论 中 占有 相当 重要 的 地 位 ， 我 们 将 在 $6.3 中 详细 介绍 复 
合 泊 松 分 布 及 其 性 质 。 我 们 也 常用 负 二 项 分 布 来 描述 理赔 次 数 w 的 分 布 ， 
这 时 称 $ 的 分 布 为 复合 负 二 项 分 布 ， 在 $6.4 中 将 研究 复合 泊 松 分 布 与 复合 
负 二 项 分 布 的 近似 模型 。 值 得 一 提 的 是 ， 在 本 章 中 抑 母 函数 是 一 个 主要 的 
工具 ， 它 对 于 研究 模型 (6. 1. 1) 表示 的 理赔 总 量 提供 了 很 大 的 帮助 。 

与 个 体 风 险 模型 不 同 ， 组 成 $ 的 项 数 NN 是 一 个 随机 变量 ， 虽 然 理 赔 额 
变量 相互 独立 ， 但 是 计算 聚合 理赔 额 3 的 期 望 值 和 方差 必须 引入 条 件 期 望 
和 条 件 方差 的 概念 。 这 些 概念 不 仅 在 风险 理论 和 精算 中 ， 而 且 在 许多 应 用 
统计 的 领域 里 都 起 着 极端 重要 的 作用 。 


$6.2 理赔 总 量 模型 


在 第 四 章 分 析 理 赔 次 数 和 理赔 额 分 布 的 基础 上 ， 我 们 开始 讨论 理赔 总 
量 模 型 。 正 如 第 五 章 中 用 个 体 风险 模型 描述 理赔 总 量 ,， 这 里 用 诊 合 风险 模 


nN 


型 描述 理赔 总 量 也 无 非 是 要 获得 理赔 总 量 S = 2 C; 的 概率 分 布 信息 。 按 顺 
序 可 类 似 地 将 讨论 归结 为 如 下 三 个 问题 : 

1. 关于 5 的 概率 分 布 和 概率 密度 ; 

2. 关于 3 的 均值 、 方 差 或 更 高 阶 甜 ; 

3. 关于 5 的 概率 分 布 的 近似 和 逼近 。 

在 以 下 两 小 节 中 我 们 首先 一 般 性 地 讨论 问题 1 和 2， 本 章 第 三 节 将 利用 
复合 泊 松 分 布 讨论 问题 3。 
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521 5 的 概 之 分 布 


首先 从 分 布 函数 的 定义 出 发 ， 直 接 计 算 聚 合 模型 (6. 1. 1) 的 分 布 函数 
和 分 布 密度 ， 设 5 的 分 布 函数 为 f,(x)， 则 有 
F(x) =P(S<x) 


有 


>P(s<xz1N-mPON = n) (6.2.1) 


P(N =0)+ VPN =n)PICI +-… +C, 夺 x} 


由 于 C,，C,，…，C, 独立 同 分 布 ， 共 同 的 概率 分 布 酒 数 为 F(x)、 概 率 密 
度 函 数 为 p(x)， 则 

P(C,+C,+. tC x)=F* Fx * F(x)=F" "(x) 
将 此 代 人 式 (6. 2.1)， 并 且 定 义 "(x) 二 1， 可 得 : 


F(x) = >, P(N = n)F'"(x) (6. 2.2) 


相应 地 ， 也 有 5 的 密度 函数 A(x) 的 表示 : 


AGOz) = > PCON=m)Pp (xz) (6.2.3) 


对 于 离散 型 随机 变量 ， 这 里 的 概率 密度 理解 为 p(x) =P{X=x|]。 

【 例 6-1】 假设 某 保单 组 合 在 单位 时 间 内 至 多 可 发 生 3 次 理赔 ， 而 且 
已 知 理赔 次 数 为 0、1、2 和 3 的 概率 分 别 为 0.1、0.3、0.4 和 0.2。 同 时 ， 
每 次 的 理赔 额 为 1、2 或 3 个 货币 单位 ， 相 应 的 概率 分 别 为 0.5、0.4 和 
0. 1。 斌 计算 理赔 总 量 $ 的 概率 分 布 。 

解 : 

已 知 : N ~ 

0.1 0.3 0.4 0.2 0.5 0.4 0.1 

按 公 式 (6.2.3) 有 


1 2 . 本 2 3 


3 


f(x) = 和 PIN=nlp(x) 


=0.1p” (xzx) +0.3p''(x) +0.4p'’(x) +0. 2p*’(x) 
其 中 : p(x) 为 0 点 的 退化 分 布 ,， p(x) =p(x),p" (x) 和 p(x) 则 需要 
通过 卷 积 递 推 计 算得 到 。 通 过 具体 的 计算 ， 结 果 列 人 表 6 -1。 


表 6 -1 例 6 一 1 的 计算 结果 
















p*"(x) 
i 


lp*1(x) =p(z) 








0. 1000 













0.2500 





























6. 2. 2 $ 的 均值 、 方 差 或 高 阶 和 
利用 命题 4-1， 将 模型 (6.1.1) 中 的 3S3 和 RN 分 别 代 人 式 (4.3. 12) 
和 (4.3. 13) 中 的 了 和 YY， 自然 得 到 以 下 的 命题 6 一 1。 


命题 6-1 车 模型 (6.1.1) 中 的 NN 和 5C 的 数学 期 望 和 方差 都 存在 ， 
则 有 
E(S) = E(N)E(C) (6. 2.4) 
Var(S) =E’(C)Var(N) + E(N)Var( C) (6.2.5) 
证 明 : 
(1) 直接 代入 式 (4. 3. 12) ， 有 
E(S) = E[E(SIN)] =E[NE(C.,)] =E(N)ECC.,) 
(2) 直接 代入 式 (4.3.13)， 有 
Yar(S) = Var[ E(SIN)] + E[ Var(SIN)] 
= Var[ NE(C.,)] + EL NVar( C.)] 
=E(C,)Var(N) + E(N)Var( C.) 
表达 式 (6. 2.4) 表明 理赔 总 量 的 期 望 值 等 于 平均 理赔 次 数 与 平均 理赔 
额 的 乘积 ， 这 与 现实 的 直观 感觉 是 相符 合 的 。 表 达 式 (6. 2.5) 可 相应 地 理 
解 为 理赔 总 量 的 方差 由 两 部 分 构成 : 一 部 分 是 理赔 量 本 身 的 方差 ， 另 一 部 
分 是 理赔 次 数 的 方差 。 
【 例 6-2】 设 理赔 次 数 w 服从 负 二 项 分 布 ， 参 数 P =1/3,Var(N) = 
2 3 4 


24 ， 又 知 理赔 额 C,~ 小 
0.1 0.4 0.5 


求 聚 合理 赔 量 S 的 均值 与 方差 
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解 : 由 已 知 条 件 ， 有 Var( WNW) 二 可 得 r=4。 因 此 ， 


E(N) = 他 =2r=2x4=8 
P 


又 由 E(C.,) =2 x0.1+3 x0.4+4x0.5=3.4 
Var(C;) =E(C?) -[E(C)]’ 
=4x0.1+9 x0.4+16 x0.5 -3.4’=0.44 
因此 有 
E(S) t+t Var(S) =E(N)E(C.) +[E(C,)’Var(N) + E(N)Var( C.,)] 
=8 x3.4+3.4* x24 +8 x0.44=308.16 
下 面 考虑 5 的 矩 母 函数 。 按 照 矩 母 函 数 的 定义 有 : 
M(t) =E(e”) =E[E(e IN)] 
=E|[M.(t)]"} =E[(e"™ "cn )] 
=M,[ ln Me(ti) ] (6. 2.6) 
因此 ， 只 要 已 知 理赔 次 数 N 的 矩 母 函数 M,(t) 和 理赔 额 C; 的 矩 母 函数 
M(t) ， 便 可 以 按照 式 (6.2.6) 将 这 两 个 孙 数 进行 复合 运算 得 到 $S 的 矩 母 
函数 。 
【 例 6-3】 假定 NN 服从 几何 分 布 ， 理 赔 额 C, 服 从 均值 为 1 的 指数 分 
布 ， 试 求 S 的 矩 母 函数 M，( 旨 及 分 布 函数 。 
解 : 由 NN 服从 几何 分 布 ， 有 
P(N=n) =pg", n=0,1,2,.…,0<g<l1,p=1-g 
按照 矩 母 函数 的 定义 ， 有 





M(t) = 2 0O<i<—~-ln(l1-p) 


1 — ge’” 
因此 ， MK (tb EL 一 有 一 一 
1 -gqM.(i) 
而 Me(D =T， 0 < <1 


代入 式 〈6.2.6)， 得 : 





M(t) =——f =p+tg 2 ， 0O<i<p (6.2.7) 


因为 pA/(p -i) 是 指数 分 布 F(x) =1-e ,xx>0 的 殷 母 画 数 ， 所 以 式 
(6.2.7) 可 以 看 做 是 对 x =0 点 的 退化 分 布 和 以 p 为 参数 的 指数 分 布 的 加 
权 。 与 此 相对 应 ， 反 解 出 S 的 分 布 函数 也 是 上 述 两 个 分 布 的 加 权 平 均 ， 权 
重 如 式 (6.2.7) 所 示 ， 即 


F(x)=pxl+gx(l-e”)=1-ge ”=1-(l1-p)e”, x 二 0 
(6.2.8) 
式 (6.2.8) 的 分 布 为 混合 型 分 布 ，F(0) =p， 分 布 隐 数 如 图 6 -1 所 示 。 


F(x) 
1.02 


1 
0.98 
0.96 
0.94 
0.92 

0.9 
0.88 
0.86 
0.84 


0 0.10.20.30.40.50.60.70.80.9 1 1.11.21.31.41.51.61.71.81.9 2 2.12.22.32.42.52.62.72.82.9 3 x 


图 6 -1 混合 指数 分 布 函数 ( 忆 =0.9) 


6.3 复合 汝 松 模型 


如 前 所 述 ， 若 N 服从 泊 松 分 布 ， 则 称 聚 合理 赔 量 模 型 (6. 1.1) 为 复 
合 泊 松 模 型 。 复 合 泊 松 模 型 在 风险 理论 中 占有 十 分 重要 的 地 位 ， 被 誉 为 风 
险 理论 的 经 典 模型 。 关 于 风险 模型 的 许多 理论 性 质 都 是 围绕 着 复合 泊 松 模 
型 进行 的 。 因 此 ， 本 节 将 专门 讨论 和 概括 复合 泊 松 模型 及 其 性 质 。 


6. 3.1 复合 泊 松 模型 的 定义 和 基本 性 质 

为 叙述 方便 ， 对 复合 泊 松 模型 重新 定义 如 下 : 

定义 6-1 称 模型 (6. 1.1) 中 的 随机 变量 5 为 参数 入 >0 的 复合 泊 松 
模型 ， 若 它 满足 : 

(1) NW 服从 参数 为 和 A >0 的 泊 松 分 布 ; 

(2) 理赔 额 变量 C,，C,，… 互 相 独 立 具有 相同 的 分 布 ， 简 称 为 理赔 人 额 
变量 C。 其 分 布 函 数 为 f(x) ，x 宇 0 ; 密度 旺 数 为 p(x) ,x 宇 0 ; 并 记 其 天 
阶 原点 抢 为 : 


pi= | widF(x) ,k=1,2,. 


0 
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(3) mV 与 C,，C,，… 互 相 独 立 。 
关于 复合 泊 松 模型 S 的 分 布 函 数 和 密度 ， 由 式 (6.2.2)、(6.2.3) 可 
直接 得 到 : 








这 eA 

F(x) = ZSPN = n)F"(x) = by (6.3.1) 

PA A (6. 3.2) 
同时 ， 由 式 (6.2.4) 和 (6.2.5) 直接 有 : 

E(S) =p.ECN) = Ap, (6. 3.3) 

Var(S) =A(p, —p’) + piA = 和 Ap， (6. 3.4) 
又 由 式 (4.3.1) 、(4. 3.2) 并 代入 式 (6. 2.6) ， 得 到 $ 的 矩 母 函 数 : 

M(t) =M,[ln M(t)] =e 0 (6.3.5) 


复合 泊 松 模型 除了 上 面 的 基本 人 性质 外 ， 还 有 很 多 特殊 的 性 质 ， 这 些 也 
是 复合 泊 松 模型 最 有 吸引 力 的 性 质 。 


6.3.2 复合 泊 松 模型 的 特殊 性 质 

我 们 基本 上 可 以 将 复合 泊 松 模型 的 各 种 特殊 性 质 归纳 为 : 对 求 和 的 封 
闲 性 、 可 分 解 性 和 分 布 计算 的 递 推 性 质 。 

1. 对 求 和 的 封闭 性 。 

定理 6-1 已 知 S,，S,，…，5S, 是 相互 独立 的 随机 变量 。 而 且 $, 为 参 
数 和 A, 的 复合 泊 松 分 布 ， 理 赔 额 变量 的 分 布 函数 为 F, (x), i=1, 2, -…, m, 


则 S=5S,+S,+…+5。 服从 参数 为 A= > ;的 复合 泊 松 分 布 ， 理 赔 额 变量 


的 分 布 函数 为 : 
F(x) = 立定 Pi(z) (6.3.6) 
证 明 : 令 M(t) 表 示 已 (z) 对 应 的 矩 母 函 数 ， 则 8, 的 矩 母 函数 为 ， 
Ms (1) =expfAi[MC) -1]}, i=1,2,. 


由 于 1 ， Dn ”9 S ,相互 独立 ， S 的 矩 母 汪 数 为 : 
M, (i) [ILMC2) 


= [1 exp{A[ M.(1) ~11}= exp{ SAM) -11} 
AM.(1) 总 
2 my | 
ol BE 3 -ls [> -十 


(6. 3.7) 








其 中 入 = 六 4, 而 式 (6.3.7) 可 看 出 $ 的 分 布 是 以 A = 并 ,为 泊 松 参 
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数 、 理 赔 额 变量 分 布 如 式 (6. 3.6) 的 复合 泊 松 分 布 。 请 读者 自行 证 明 分 布 
" AM.,(i) 
各 入 

该 定理 对 于 建立 保险 风险 模型 具有 两 方面 的 意义 : 第 一 ,在 考虑 由 多 
个 保单 组 合 构 成 的 总 业务 组 合 时 ， 若 这 些 保单 组 合 之 间 是 相互 独立 的 ， 而 
且 每 个 保单 组 合 的 总 理赔 模型 均 为 复合 泊 松 模型 ， 则 总 业务 组 合 的 总 理赔 
模型 依然 为 复合 泊 松 模型 。 第 二 ,在 考虑 同一 保单 组 合 在 若干 个 连续 保险 
年 度 中 的 理赔 总 量 的 分 布 时 ， 若 每 个 保险 年 度 的 理赔 总 量 都 是 复合 泊 松 模 
型 而 且 相 互 独立 ， 即 使 它们 未 必 具 有 相同 的 分 布 ， 这 些 年 的 理赔 总 量 也 将 
服从 复合 泊 松 模型 。 

【 例 6-4】 已 知 S=S+S， 且 3 与 5, 为 相互 独立 的 两 个 复合 泊 松 模 
型 ， 泊 松 参 数 分 别 为 和 A, =2 和 和 A, =3， 理 赔 额 变量 的 分 布 分 别 为 : 


1 2 1 2 3 4 
es 


(6. 3.6) 的 矩 母 机 数 为 所 示 复 合 泊 松 分 布 的 矩 母 聘 数 。 和 





0.6 0.4 0.1 0.3 0.5 0.1 
试 计 算 总 理赔 量 $ 的 方差 以 及 其 理赔 额 变 量 C 的 方差 。 
解 : Var(S) = Var(S,) + Var( 5S,) 
=AE(CI) +A,E(C;) 
=2{1 x0.6+2 x0.4} +3{1 x0.1 1+2’ x0.3 +3’ x0.5 +4 x0.1| 
=26.6 
由 定理 6 -1 知 $S 服 从 复合 泊 松 模型 而且: 
和 A=A,+A,=5 
设 S 对 应 的 理赔 额 变量 为 C~F(x)， 则 


信 A 入 2 3 
p(x) = Pp1(*) + Pa(*) = 5Pi(x) + 5P1(*), x=1, 2, 3, 4 
因此 有 
2 3 
p(1) = Pi(1) + “3p2(1) =0.4 x0.6 +0.6 x0.1=0.3 


p(2) =0.4 x0.4+0.6 x0.3 =0.34 
p(3) =0.4x0 +0.6x0.5=0.3 
p(4) =0.4 x0 +0.6 x0.1=0.06 


进而 有 
E(C) =1 x0.3+2 x0.34 +3 x0.3 +4 x0.06 =2.12 
E(C’)=1 x0.3 +2’ x0.34 +3’x0.3 +4’ x0.06 =5.32 
Var(C) =E(C) -(E(C))’=5.32—2.12’=0.83 全 
2. 可 分 解 性 。 
定理 6-2 假设 随机 变量 $S 服从 复合 浪 松 分 布 ,参数 和 A >0， 理 赔 额 
为 离散 随机 变量 ， 概 率 蚂 数 为 7,=P(C=x), i=1, 2,，…，,m， 其 中 x, 表 
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示 理 赔 额 变量 的 取 值 。 车 记 N, 为 $ 中 取 值 为 *. 的 次 数 ，i=1，,，2,… 


则 有 
N=N +tN,+… tN, N>0 
0 N=0 
ee N>0 
则 以 下 结论 成 立 : 
(1) N,，N;，…，N, 王 相 独 立 ; 
(2) Ni 服从 参数 为 A; = AT, 的 泊 松 分 布 , i =1, 2, …,，m。 
证 明 : 随机 向 量 (N,，N,，…，N,) 的 矩 母 汰 数 为 : 
M(t ,ts) = 五 [exp( Fn)], ti 0,t, 2 0, ,lt, 


由 我 们 在 定理 4 -3 中 介绍 过 的 多 项 分 布 的 概念 ， 计 算 可 知 多 项 分 布 的 矩 母 


函数 为 : 


有 (0 ) = (Ae tA.e" 十 全 ee ) 


(6.3.8) 


在 本 定理 中 ，N 表示 试验 次 数 ， 当 NN 取 固 定 的 正 整 数 nn 时 , (WN,, WN,， 
…，NW。) 服从 参数 为 (n，7，,，…，7。) 多 项 分 布 ， 矩 母 函数 如 〈6.3.8) 


所 示 ， 对 于 随机 变量 W， 可 以 用 全 概率 公式 求 出 矩 母 函数 : 


ll 


El exp ( DN)] 2, ELexp ( DN.) IN= nl]P(N = 了) 





~ i Wy 
= $me' te tne")" 
n=0 nt! 
: [A 》 me”]" 
-A i=1 
' > nl! 


e™ y 气 ( 其 中 i Dy TE*) = ee 


n=0 


m 


= ep {BE am -D1 = Hpiane -D)| 


上 面 乘 积 式 中 的 第 i 项 对 应 着 参数 为 Amr; 的 泊 松 分 布 的 矩 母 丽 数 ， 而 且 上 式 
对 于 任意 的 一 组 二 0, 如 宇 0，…， 刀 宇 0 都 成 立 ， 因 此 W 可 以 按照 结论 


(1) 和 (2) 的 情形 进行 分 解 。 
下 面 我 们 通过 两 个 例子 来 讨论 定理 6 -2 的 应 用 。 


若 保险 合同 约定 理赔 按照 以 下 免 赔 方式 进行 ， 保 险 人 的 每 次 理赔 额 为 


Y=X-dl(X>d) 


其 中 参数 d 为 免 赔 额 ， 为 实际 损失 额 ， 了 为 保险 公司 的 理赔 额 变 量 。 如 果 
在 某 一 段 固定 时 间 内 损失 发 生 次 数 是 参数 为 A 的 泊 松 变量 ， 则 由 定理 6 -2 


可 知 理 赔 次 数 是 参数 为 Ap 的 泊 松 变量 ， 其 中 : 
p=PIX>d| 
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i 
理赔 额 变 量 的 分 布 密度 是 : 
fy(x) Seta x>0 
pb 


因此 ， 理 赔 总 额 是 泊 松 参数 为 Ap 、 理 赔 额 变量 的 分 布 密度 为 f,(x) 的 复合 
泊 松 随机 变量 。 

【 例 6~5】 某 种 一 年 期 的 医疗 保险 损失 模型 为 : 理赔 次 数 服 从 参数 为 
A=0.12 的 泊 松 分 布 ， 实际 损失 变量 相互 独立 ， 其 分 布 见 表 6 -2。 保 险 约 
定 免 赔 额 为 150 元 ,赔偿 限额 为 750 元 ， 即 赔付 时 被 保险 人 自 付 150 元 以 
内 的 损失 ， 保 险 人 赔付 剩余 的 损失 ， 但 赔付 总 量 不 超过 600 元 。 试 分 析 保 
险 人 在 保险 期 间 内 总 赔付 的 分 布 。 


表 6 -2 实际 损失 分 布 (单位 : 50 元 ) 












































解 : 由 表 6 -2 知 实际 损失 额 超过 150 元 (3 个 货币 单位 ) 的 概率 为 
1-Fx(3) =0.94， 按 照 合 同 规 理赔 额 变 量 的 分 布 为 : 


+3 
人 xx=1,2,…,11 
p(x) = 
1—-F,(14 
i a 


因此 ， 保 险 人 在 一 年 内 的 总 成 本 服从 泊 松 参数 为 0. 12 x0.94 =0. 1128 的 复 
合 激 松 模型 ，P(x) 和 已 (xz) 具体 值 见 表 6 -3。 


表 6 -3 实际 损失 分 布 (单位 : 50 元 ) 












0.0212766 | 0. 0212766 0. 0638298 | 0. 212766 0. 0957447 | 0. 5638298 






2 0. 0319149 | 0. 0531915 0. 0744681 | 0. 2872340 0. 0957447 | 0. 6595745 






3 0.0425532 | 0. 0957447 0. 0851064 | 0. 3723404 0. 0851064 | 0. 7446809 








0. 0531915 | 0. 1489362 0.0957447 | 0.4680851 0.2553191 1 


























和 
【 例 6-6】 已 知 聚 合理 赔 $ 服从 复合 泊 松 模型 ， 泊 松 参 数 A =0.8， 理 
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。 试 用 两 种 方法 分 别 计算 $ 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 > 
2 
赔 额 变量 的 概率 函数 为 : 
0.25 0.375 0.375 
的 概率 函数 六 (*) =P1S=x| 在 x=0,，1，,，…, 6 的 取 值 。 
解 : 
方法 一 : 直接 用 式 (6.3.2)， 有 
f(x) eA > p(s) = > ep'"(x), 
计算 结果 如 表 6 -4 所 示 。 
表 6-4 方法 一 的 计算 结果 
六 "2 (zx) 








0. 0625 


* 100， 


nw DD ~ OlNn 


0. 1875 
0. 328125 
0. 28125 
0. 140625 


0. 015625 
0. 070313 
0. 175781 
0. 263672 








0. 003906 
0. 023438 
0.076172 












0. 000977 
0. 007324 


fs (x) 





0. 000024 


e-0.8 


0. 2e -08 
0.32e 08 
0. 36e -098 
0. 1le 98 
0. Ile -908 
0. 07e 08 



































方法 二 : 
S 分 解 为 : 
S=1N, +2N,+3N, 
由 定理 6 -2，N,、N, 和 N, 相 互 独 立 且 服从 参数 分 别 为 和 A, =0.25 x0.8 = 
0.2，A, =0.375 x0.8 =0.3，A;, =0.375 x0.8 =0.3 的 泊 松 分 布 ， 只 需 作 两 


由 于 理赔 额 变量 的 取 值 仅 有 1、2 和 3 三 种 情况 ， 所 以 可 以 将 


? 


次 卷 积 运算 即 可 得 到 如 表 6 -5 所 示 的 结果 。 



























表 6 -5 方法 二 的 计算 结果 
PIN =z| P{2N, =x| Pl3Ns =x} |PLN +2N =zx| | fs(x) =P{N, +2N, +3N, =zx| 
0 0.818731 | 0.740818 0.740818 0. 606531 0. 449329 
1 0. 163746 一 一 0. 121306 0. 089866 
2 0. 016375 0. 222245 一 | 0.194090 0. 143785 
3 0. 001092 一 0. 222245 0.037201 0. 162358 
4 0. 000055 0. 033337 一 0. 030974 0. 049906 
5 0. 000002 一 一 0.005703 0.047960 
6 0 0. 003334 0.033337 0. 003288 0. 030923 














面 

通过 例 6 -6 可 以 看 出 ， 在 计算 聚合 理赔 S 的 分 布 时 ， 利 用 复合 泊 松 
分 布 的 可 分 解 性 可 以 减少 卷 积 运算 的 工作 量 。 事 实 上， 利用 分 布 计算 的 
递 推 性 质 ， 还 可 以 大 大 提高 计算 的 速度 并 且 递 推 的 方法 更 适用 于 计算 机 


编程 。 
3. 分 布 计 算 的 递 推 性 质 。 
定理 6-3 对 于 复合 泊 松 模型 (6. 1.1)， 当 理赔 人 额 变量 C 取 值 于 正 整 
数 ， 有 如 下 的 f,(x) 和 迭代 公式 : 
六 (0) =e 
f(x) = OF ipfls i, = 1,2,3， (6. 3.9) 
证 明 : 首先 考虑 如 下 的 条 件 期 望 计算 : 
E(C,IC,+C,+:… +C,,. =%), k=1,2,3,.…,n+l 
显然 有 
VY ECC,! 了 直人 = x， ee Be ke (6. 3. 10) 
由 C, 同 分 布 的 条 件 ， 可 知 式 〈6.3. 10) 左边 各 项 都 相等 ， 从 而 有 
BE(CC+…+C=x) = ey We ee EE 
按照 条 件 期 望 的 定义 ， 有 


n+l nt z n 
E(C.| DC =*) = E(C,, | ZC =x) = DPIC,., =7| 2 = x| 
i=I 上 = i= 





= Dj pe 
a P C. = x} 
{> x 
a li 
了 1 p (x) 


因此 有 


x 
nti+l 


因此 ， 当 x=1，,，2,，3，… 时 ,按照 定义 直接 有 





p(x) > ip(i)p' "(x zi) ， 多 一 1， 2， 站 
i=1 


f(x) = P| DC = x| 


nt+l a n+l -A 
_ (a 村 A e wn+l 
PHN SoH TIPl DO hs i (x) 


nt+l 一 人 


二 p> 让 二 x 六 ip(p (zx -i) b> Met py 5 p""(x—i) 


i=1 i=1 








= ED pi) f(x-i) 可 


i=1 


【 例 6-7】 试用 定理 6 -3 的 迭代 方法 重新 计算 例 6 -6。 
解 : 由 已 知 和 =0.8, f.(0) =e"*， 由 式 (6.3.9),， 有 


(1) = 二 (1)A(0) =0.8 x0.25 x 广 (0) =0.2e 


101 ， 


二 一 > 
0.8 -0.8 
£.(2) =2 !{0. 25f.(1) +2 x0.375A(0)} 上 =0. 32e 
£.(3) = {0. 25f.(2) +2 x0.375A(1) +3 x0.375f,.(0)} 
=0. 36e 


其 结果 与 例 6 -6 相同 的 结果 ， 具 体 见 表 6 -5。 

【 例 6-8】 设 某 保险 人 的 总 风险 服从 复合 泊 松 模型 ， 年 平均 理赔 次 数 
为 0.2 次。 在 任何 一 次 理赔 中 ， 有 80% 的 概率 会 损失 1 万 元 ，20% 的 概率 
会 损失 2 万 元 。 试 计算 保险 人 总 损失 的 概率 分 布 。 

解 : 为 简化 表达 ， 我 们 用 1 万 元 表示 单位 货币 ， 因 此 有 

A=0.2,p(1) =0.8=1-p(2) 
根据 递 推 公式 (6. 3.9)， 可 得 : 
f.(0) =e =e ”=0.818731 
fi.(1) =Ap(1)f(0) =0.2 x0.8 x0. 818731 =0. 130997 


f:(2) = 分 1p(1) 太 (1) +2p(2)A(0)1 =0.043229 


大 (3) = 全 1P(1) 太 (2) +2p(2)f.(1)1 =0.005799 


如 此 和 迭代 下 去 ， 结 果 列 人 表 6 -6。 
4. 递 推 性 质 的 应 用 一 一 限 表 6-6 总 损失 的 概率 分 布 














人 额 损失 再 保险 问题 。 最 常见 的 两 fs(x) Fs (x) 
种 最 基本 的 再 保险 方式 为 : 限额 0 0. 818731 0. 818731 
损失 再 保险 〈 也 称 超 额 超 赔 再 保 1 0. 130997 0. 949728 
险 ) 和 比例 再 保险 。 若 将 直接 承 2 0. 043229 0. 992957 
保 的 聚合 理赔 记 为 S$， 则 上 述 两 3 0. 005799 0. 998755 
种 再 保险 模型 可 分 别 表 示 如 下 : 4 0. 001097 0. 999852 
限额 损失 再 保险 : 5 0. 000128 0. 999980 
0 S<z 6 0. 000018 0. 999998 
1(S) -| : 
SS 一双， S>d 时 
(6.3.11) 
损失 比例 再 保险 : 1(S) =kS， 0<k<l (6. 3. 12) 


有 了 时， 在 不 会 产生 误解 的 前 提 下 将 1,(5) 简 记 为 1。 正如 第 四 章 中 所 强 
调 的 ， 限 额 损失 再 保险 模型 无 论 在 理论 上 还 是 在 实际 中 都 具有 特别 的 重要 
性 ， 因 此 是 讨论 的 重点 。 式 〈6.3.11) 中 的 d 同样 称 为 免 赔 额 ， 对 原 保 险 
人 来 说 ，d 起 到 了 “限制 损失 ”的 作用 ， 因 为 超过 额度 d 的 部 分 即 1 就 是 
再 保险 人 承担 的 风险 ， 而 原 保险 人 自 留 的 风险 则 是 : 
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$, S<d 
s-1(5) ={, sa (6. 3. 13) 
即 S 被 分 解 为 S=(S-7) + 
显然 ,无论 对 原 保 险 人 还 是 对 再 保险 人 来 说 都 必须 研究 最 佳 的 d 是 什 
么 ， 即 自 留 多 少 、 分 保 多 少 的 问题 。 更 为 基础 的 问题 是 : 限额 损失 再 保险 
理赔 额 1, 的 均值 ， 即 纯 保 费 E(1,)。 设 5 的 分 布 函数 为 xs(x)， 密 度 汰 数 为 
f(x)， 则 有 


E(1,) 


[a Af.(x) dx 


E(S) -d+ /Cd -sf(x)d (6. 3.14) 


s [a F(x) Jdx 


E(S) so — F(x)]dx (6. 3. 15) 
特别 地 ， 当 理赔 S 仅 取 非 负 整数 值 并 且 d 也 是 整数 时 ， 有 
E(1,) = > (x — d)fs(x) 


= fs(d +1) +2fs(d +2) + (6. 3.16) 
= E(S) -d+ bE — x)f.(x) (6. 3. 17) 
Se 

芭 -Fi(d)]+[lI-FCd+1)]+… (6. 3. 18) 
= E(S) -Fn — F(x)] (6. 3. 19) 


由 这 些 不 同 的 表达 式 还 可 以 导出 关于 E(1,) 的 递 推 公 式 : 
E(1i1) =E(L,)-[1-F(d)], d=0,1, 2, ., E(1,) =E(S) 


(6.3.20) 
DX, N>0 0 1 2 3 

【 例 6 -9] ee ， 其 中 理赔 次 数 N - 、 
0， N=0 0.1 03 04 0.2 


1 2 3 
理赔 额 变量 X~| ]， 试 计算 2(4)。 


0.5 0.4 0.1 
解 : 因为 NN 的 最 大 值 为 3，S 的 最 大 值 为 9， 所 以 用 公式 (6.3.16) 计 
算 E(1,) 比较 简洁 。 


f(8) = P(TX =81N= 3)P(N = 3) 


(ex = 3)P(X, = 3)P(X, = 2)P(N = 3) 
2 
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-3x201xo.4xo.2=0.0024 
2x1 





fs(9)= P(D X=91N = 3)P(N = 3) 
P(X, = 3)P(X, = 3)P(X, = 3)P(N = 3) 
0.1’ x0.2 = 0.0002 


因此 有 
E(L,) = 六 (8) +2A(9) =2.8 x10™ 配 
【 例 6 -10】 设 聚 合理 赔 $ 为 复合 泊 松 分 布 ， 参 数 A =1.5， 理 赔 额 变量 的 
分 布 是 p(1) = 子 =1-P(2)， 试 计算 太 (z) 、Fs(x) 和 EE(1),x=1, 2, …, 10。 
解 : 因为 理赔 额 变量 X 的 取 值 只 有 整数 1 和 2， 所 以 聚合 理赔 5 的 取 
值 也 是 非 负 整数 ， 而 且 ，- 一 、 二 阶 原点 矩 为 





六 =1x 了 +2x 本 = 全, 记 =1x +22 xx 一 =2 
由 复合 泊 松 分 布 的 迁 代 公式 (x) = 全 袜 因 (7) 太 (zs -y) ， 有 
f.(0) =e° rs,f(1) =1.5 x 卫 x 六 (0) = er 


f(x) = 3 -1) +37:(*-2)] - 工 [A(z-1) f(z-2)],  %=2,3,.: 
i i 


F(x) =F,(x-1)+f(x), x=1,2,. 
因此 有 
E(1) =E(1,.,) -[1-F(x-1)], x=1,2,. 
E(h) =E(S) =Ap, =2 
具体 计算 结果 (保留 到 小 数 点 后 3 位 ) 见 表 6 -7。 








表 6 -7 例 6 -10 的 计算 结果 
x f(x) | Fs(x) E(1.) 
0 0. 223 0. 223 2. 00 
1 0. 223 0.446 1.223 
2 0. 223 0. 669 0.669 
3 0. 149 0.818 0. 339 
4 0. 093 0.911 0.157 
5 0.048 0. 959 0. 068 
6 0. 024 0. 983 0.027 
7 0.010 0. 993 0.011 
8 0. 004 0. 997 0. 004 
9 0. 002 0. 999 0. 001 
I0 0. 001 1. 000 0. 000 











从 例 6 -10 可 以 发 现 ， 随 着 自 留 额 的 上 上升， 再 保险 的 风险 逐渐 降低 ， 
而 且 ， 有 时 可 能 对 于 不 是 很 大 的 自 留 额 (如 本 例 中 的 x=10 ) 就 会 使 再 保 
险 的 平均 损失 接近 于 零 。 

5. 递 推 性 质 的 拓展 。 定 理 6 -3 的 和 迭代 公式 不 仅 对 复合 泊 松 分 布 成 立 ， 
对 于 如 二 项 分 布 、 负 二 项 分 布 、 几 何 分 布 等 其 他 分 布 也 可 导出 类 似 的 公式 ， 
实际 上 ， 类 似 式 (6.3.9) 的 递 推 公式 对 (a,，5,，0) 类 计数 随机 变量 都 
成 立 。 

定理 6-4 若 模 型 (6.1.1) 中 的 理赔 次 数 N 服 从 (a,，5,，0) 类 计数 
分 布 ， 而 且 理 赔 额 变量 C 取 值 于 于 整数， 则 有 如 下 关于 理赔 总 额 概率 分 布 
半数 f(x) 的 和 迭代 公式 : 

A(CO) =P(N=0) 
二 5 (a+ sp -i), x = 1,2,3, ... (6.3.21) 


定理 6 -4 的 证 明 与 定理 6 -3 的 证 明 类 似 ， 这 里 不 再 重复 。 


$6.4 于 合理 赔 莉 的 近似 模型 


在 前 三 节 我 们 讨论 了 总 理赔 模型 (6. 1.1) 的 精确 分 布 ， 我 们 现在 就 复 
合 泊 松 分 布 和 复合 负 二 项 分 布 的 情况 讨论 聚合 理赔 的 近似 分 布 。 下 面 分 两 
种 情形 讨论 : 在 理赔 分 布 基本 上 对 称 的 情形 采用 正 态 近似 ， 在 理赔 分 布 有 
偏 斜 的 情形 采用 平移 伽 玛 分 布 近 似 。 


6.4.1 正 态 分 布 近似 
定理 6~-5 
(1) 当 模 型 (6. 1.1) 为 复合 泊 松 模型 、 泊 松 参数 为 4、 理 赔 额 变量 
的 分 布 明 数 为 F(x) 时 ， 有 
pe ke 
Ap, 
的 分 布 当 4 一 o 时 趋 于 标准 正 态 分 布 ， 其 中 p,、p; 分 别 为 F(x) 对 应 的 1 
阶 和 2 阶 原 点 矩 。 
(2) 当 模 型 (6. 1.1) 为 复合 负 二 项 分 布 ， 参数 为 r 和 pp， 理赔 额 变量 
的 分 布 画 数 为 F(x) 时 ， 


MA 





的 分 布 当 一 m 时 趋 于 标准 正 态 分 布 。 
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证 明 : 


(1) 对 于 泊 松 分 布 的 情形 ， 我 们 将 通过 证 明 M,(i) 的 极限 为 o 来 证 明 
定理 的 结论 。 


号 一 人 
由 也 = 二 一生 可 得 : 
VAP 


M,(t) =m,| | 


i 
lexpl 一 
W APs | Ap, 


又 由 式 (6.3.5) 得 : 


EN 


再 由 M.(i1) =1 + + +.…， 得 








M,(1) = exp [去 +o[( 亏 ]] ,t>0 


当 4% 时 ,Ms(1) ef, DT limM(t) = 号。 
(2) 对 于 负 二 项 分 布 的 情形 ， 证 明 过 程 类 似 ， 不 再 费 述 。 加 


6.4.2 平移 伽 玛 分 布 近似 
。 若 $ 为 复合 泊 松 模型 ， 其 三 阶 矩 为 : 
EL[(S-E(S))’] =Ap, 

显然 不 一 定 为 0; 

。 若 5 为 复合 负 二 项 分 布 ， 其 三 阶 矩 为 : 
aig Pip ig 
Pp Pp Pp 
显然 也 不 一 定 为 0。 因 此 ， 这 时 5 的 分 布 是 有 偏 斜 的 。 由 于 正 态 随机 变量 的 
分 布 是 对 称 的 ， 因 此 当 5 的 偏 度 较 大 时 使 用 正 态 近似 并 不 合适 ， 如 果 考 虑 
选用 平移 伽 玛 分 布 进行 近似 ， 可 能 更 为 恰当 。 

这 里 我 们 用 Gamma (x; w，B8) 表示 参数 为 a 和 B 的 伽 玛 随机 变量 的 
分 布 函数 ， 即 


BE[(S-BCS)) ] = 


je-le -让 
Gamma (x; a, B) = 


J TO pr dt 
对 任意 的 点 x >0， 定 义 如 下 新 的 分 布 函 数 ， 称 其 对 应 的 随机 变量 服从 平移 
伽 玛 分 布 : 
H(zx;a,B,X%0) = Gammal(x -xo;o,B), XxXo (6.4.1) 
这 个 分 布 相当 于 将 分 布 Gamma(%;a,B) 平移 了 x 个 单位 。 
平移 合 玛 分 布 包含 参数 a、B 和 x,。， 通 过 简单 的 推导 易 知 平移 伽 玛 分 





xX 宇 0 


布 ( 这 里 也 用 五 代表 该 分 布 对 应 的 随机 变量 ) 的 一 、 二 及 三 阶 中 心算 分 
别 为 : 
E(H) =x, +aB,Var(H) =aB’,E{I[H-E(H)]’} 
=2ap8’ (6.4.2) 
在 用 平移 伽 玛 分 布 来 近似 聚合 理赔 S 时 ， 我 们 采用 中 心算 相等 的 原则 ， 
令 平 移 伽 玛 随机 变量 和 聚合 理赔 $ 的 一 、 二 、 三 阶 中 心算 相等 ， 因 此 有 如 
下 三 个 关于 近似 平移 伽 玛 分 布 的 参数 方程 : 
E(S) =x, +aB,Var(S) =aB’,E{[S-E(S)]| =2ap8’ (6.4.3) 











解 得 
< 全 允 曾 
i 
特别 地 ， 对 于 复合 泊 松 分 布 ， 有 
Ap 2A “=44 鲜 ， = 区 (6.4.5) 


再 回 到 式 (6.4.3)， 若 取 参 数 B 的 一 个 从 右面 趋 于 0 的 序列 B, 一 0， 
然后 令 : 


， 其 中 Us(-c，+co)， ay>0 为 常数 


则 当 B, 一 0 时 ， 有 : xz 一 -co ，a 一 o ， 分 布 H(x: a,B,xo) 趋 于 NG )。 
因此 ， 正 态 分 布 可 以 看 做 是 这 种 三 个 参数 分 布 的 一 种 极限 情况 ， 从 这 个 意 
义 上 说 ， 平 移 黎 玛 分 布 近 似 是 正 态 近似 的 推广 情况 。 

【 例 6-1IL】 考虑 某 参数 和 =16 的 泊 松 分 布 ， 试 用 平移 伽 玛 分 布 和 正 
态 分 布 近似 该 分 布 。 

解 : 泊 松 分 布 随机 变量 W 可 看 做 是 理赔 额 变量 C 退化 为 仅 在 1 个 货 


单位 点 取 值 的 一 种 复合 泊 松 分 布 ， BBN= 2 Ci,P(C., 过 1)= 1,2 二 二 > 
因此 C 的 各 阶 矩 为 : 


Pp:=1, k=1, 2, 3 
由 式 (6. 4.5)， 则 有 
Xo = 一 入 ， Qa =4A,， B=2 


解 得 : x,。= -16, a=64, B=2。 
车 采用 正 态 近似 ， 参 数 为 : 
LL=A=16, og =VA =4 
因为 N 的 分 布 函 数 有 解析 表达 式 ， 可 以 直接 计算 ， 所 以 表 6 -8 比较 了 三 个 
分 布 在 x=5，10，15，…，40 的 分 布 郑 数 结果 。 需 要 注意 的 是 ， 表 6 -8 
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对 两 个 连续 近似 分 布 在 各 点 的 值 按照 中 点 值 进行 了 修正 。 
从 表 6 -8 可 以 看 出 ,平移 伽 玛 分 布 的 近似 效果 显然 要 比 正 态 分 布 好 
得 多 。 






















表 6 -8 用 平移 伽 玛 分 布 和 正 态 分 布 近似 泊 松 分 布 
精确 分 布 〈( 汽 松 分 布 ) 近似 分 布 

7 立 站 Gamma(z + 16.5;64,2) (2 

5 0. 001384 0. 001636 0. 004332 

10 0.077396 0.077739 0. 084566 

15 0. 466745 0. 466560 0. 450262 

20 0. 868168 0. 868093 0. 869705 

25 0. 986881 0. 986604 0. 991226 

30 0. 999433 0. 999378 0. 999856 

35 0. 999988 0. 999985 0. 999999 
1. 000000 1. 0000000 1. 000000 





Lj 
【 例 6 -12】 假设 5S 服从 复合 泊 松 分 布 ， 参数 A =12， 且 理赔 额 变 量 X 
在 [0，1] 上 均匀 分 布 ， 试 分 别 用 正 态 近 似 和 平移 伽 玛 近似 计算 P(S <10) 。 


解 : 经 过 简单 的 计算 ， 易 知 : P = 于, ps = 村, Pp, = 地 ; E(S) = Ap, =6， 
Var(S) =Ap, =4, EL[S-E(S)]’ =Ap,=3 


车 采用 正 态 近似 ， 有 





P(S <10) =P( <2) =®(2) =0.9772 
车 采 用 平移 伯 玛 近似 ， 由 式 (6.4.3) 有 
6=x,。+apB 
上 
3 =20p’ 
解 得 
a =256/9 
| 
xu = 一 1473 
因此 ， P (5<10) =- Gamma (0, 了 = 0. 9682 m 


第 六 章 ”短期 聚合 风险 模型 


$6.5 个 体 风 险 各 型 与 复合 泊 检 模型 的 关系 


第 五 章 中 的 个 体 风 险 模 型 是 以 每 张 保 单 为 基本 元 素 ， 而 本 章 的 聚合 风 
险 模 型 则 是 以 每 次 理赔 为 基本 对 象 ， 并 且 一 般 考 虑 复合 泊 松 模型 。 虽 然 考 
虑 的 模型 不 同 ， 但 是 问题 的 背景 是 相同 的 ， 所 以 可 以 考虑 用 复合 汽 松 模型 
近似 个 体 风 险 模 型 ， 并 分 析 两 个 模型 之 闻 的 关系 。 

现 有 由 n 张 独 立 的 保单 组 成 的 保单 组 合 ， 每 张 保单 至 多 发 生 一 次 理赔 ， 
而 且 第 i 张 保单 发 生理 赔 的 概率 为 : P(1,=1) =g;; 第 i 张 保单 发 生理 赔 后 
的 金额 为 : B,~f.(x) ,x >0， 相 应 地 ， 总 理赔 S 的 模型 为 : 


S= TX= 18 (6.5.1) 
车 记 HL = E(B,) ,a = Var(B.,) 
则 有 EC(S) = PECX) = DE(LB) = 了 Ha， (6. 5. 2) 
Var[ S$S] = DVar(X,) 兰 > [ac +Aai(1 -gq.)] (6.5.3) 


下 面 考虑 从 两 个 方面 用 复合 泊 松 模型 近似 式 (6.5.1) 的 个 体 风 险 
模型 。 
1. 我 们 以 发 生 总 理赔 额 的 均值 不 变 为 原则 进行 复合 激 松 近似 。 由 于 


瑟 ( > 1.) = >， 9 


车 以 A = 对 9 作为 泊 松 分 布 的 泊 松 参数 ， 考 虑 服从 以 下 分 布 的 理赔 额 变量 
B. 


全 
B ~/f(x) = Be (6.5.4) 
考虑 如 下 的 复合 泊 松 模型 : 
S = > A (6.5.5) 
0 N=0 


其 中 : N 为 参数 和 A = gq, 的 泊 松 分 布 ,独立 同 分 布 ， 共 同 分 布 如 式 


(6.5.4) 所 示 。 则 式 (6.5.5) 可 看 做 是 (6.5.1) 的 一 种 泊 松 模型 近似 ， 
而 且 有 


E(S) = AE(B) = > pq,, Yar(S) = AE(B’) = DA + 01) 


(6. 5.6) 


精算 模型 


则 式 (6. 5.5) 与 (6.5.1) 的 均值 相同 ,但 方差 偏 高 ， 而 且 两 个 方差 的 差 
距 为 : 


Dg +o) - Dlgo +pq(l -9)]1 = >mqi > 0， 
i=] i=l a=1 


对 于 理赔 额 变 量 B， 其 一 阶 、 二 阶 原 点 和 矩 还 可 表达 为 : 


E(B) = xp 全 DP AH 
ECB) = 5 Ce + = DA + oo) 
其 中 ,4,= 于， 满足 A， = 1 ， 对 照 式 (6.5.6) ， 可 知 在 以 式 (6. 5.5) 


满 
近似 的 复合 泊 松 模型 中 ， 理 赔 额 的 均值 和 二 阶 原点 和 抢 可 看 做 是 对 每 一 张 保 
单 理 赔 额 的 一 阶 、 二 阶 原点 矩 的 加 权 平 均 。 
2. 我 们 以 不 发 生理 赔 的 概率 不 变 为 原则 进行 复合 泊 松 近似 。 对 于 参数 


为 A 的 泊 松 分 布 W， 有 


P(N=0)=e 
对 于 模型 (6. 5. 1)， 


PC > 1, = 0) =(1 ~ gi)-…(1 — gq,) 


若 令 e*= (1 -qi) … (1 -9g,) (6.5.7) 
则 有 Ne Dln(1 -9) = DX, (6. 5.8) 
其 中 ， N= -In(l-g) = +e +>, 


这 时 的 近似 模型 仍然 为 式 (6. 5.5)， 理 赔 额 分 布 仍然 为 式 (6.5.4)， 只 是 


泊 松 分 布 N 的 参数 为 和 A。 因此 , 在 由 式 (6.5.8) 得 到 的 近似 模型 
(6.5.5) 中 ，S 的 均值 和 方差 都 比 式 (6. 5.6) 偏 高 : 


E(S) = AE(B) = YA,xp > Yap 
icl i=1 


Var(S) = AE(B’) 


> Ai +0) > Dap +o) > L gio +17q:(1 一 9)] 
【 例 6-13】 现 有 由 n=100 张 独 立 的 保单 组 成 的 保单 组 合 ， 每 张 保单 
至 多 发 生 一 次 理赔 ， 而 且 发 生理 赔 的 概率 为 4 =0. 05， 理 赔 金额 服从 相同 的 


1 2 
分 布 ， 记 做 B ~ 四 a ,): 试 讨论 对 理赔 总 量 S 的 分 布 近似 。 


.110， 


解 : 按照 个 体 风 险 模 型 ， 理 赔 总 量 为 : 


S= > X= YLB 
P{I,=1} =0.05 =1-PIl =0} 
由 于 E(X.) =0.05 x E(B) =0.05 x1.2 =0.06 
Var(X,) =g(1 -gq)E’(B) +gqVar(B) =0.0764 
因此 有 EC(S) =100E(X) =6,Var(S) =100Var(X) =7.64 


100 


按照 聚合 风险 模型 的 观点 ， 设 NN 为 理赔 次 数 ， 则 NN = > 1; ， 理 赔 额 的 
分 布 还 是 B, 的 分 布 。 这 里 的 入 显然 不 是 沂 松 分 布 而 是 一 个 二 项 分 布 : 
E(N) =ng =5,Var(N) =npg=4.75 
设 5 的 概率 函数 为 /,(x) =P1S=xi， 由 式 (6.2.3) 知 : 
f(x) = > PIN = nip'"(x) 
其 中 p(x) 是 B 的 概率 肾 数 的 n 次 卷 积 ， 要 算出 它 的 最 后 表达 式 是 比较 复 
林 的 ， 在 第 二 章 中 我 们 讨论 过 它 的 正 态 近似 ,， 但 由 于 这 个 渔 数 是 非 负 的 ， 
通常 向 右 偏 人 入， 正 态 近 似 往 往 低 佑 了 它 落 入 均值 右边 尾部 的 概率 。 我 们 现 
在 考虑 用 复合 泊 松 模型 来 近似 f,(x)。 
首先 按照 式 (6. 5.6) 进行 近似 ， 泊 松 参 数 为 A =ng=5, p(x) 为 B, 的 
概率 落 数 ， 按 照 复合 泊 松 模型 的 性 质 ，5 的 泊 松 近似 5 有 : 
E(S) =AE(B,) =6,Var( $S) = AE(B') =8 
均值 相同 ,但 复合 泊 松 模型 对 方差 的 估计 较 大 ， 显 得 比较 “保守 ”。 
然后 按照 式 (6. 5.8) 进行 近似 ,， A;= -ln(1 -9)= -ln0.95 = 
0. 05129 ,入 =5. 129 ， 
E[ S] = AE(B,) =5. 129 x1.2=6.155 


Var( $S) = AE(B’:) =5. 129 x1.6=8.207 
均 高 于 前 一 种 近似 方法 的 结果 。 


习题 


1. 著 3$ 是 某 地 区 1 工 年 内 的 降雨 量 之 和 ， 试 用 随机 和 模型 刻画 S。 

2. 如 果 短 期 聚合 风险 模型 中 的 理赔 次 数 NN 服 从 二 项 式 分 布 B(n,p)， 
其 中 的 参数 p 服 从 [0, 1] 的 均匀 分 布 ， 利 用 全 概率 公式 计算 : (1)NN 的 给 
母 函 数 ; (2) NN 的 均值 ; (3) NN 的 方差 。 

3. 证 明 : 如 果 NN 服 从 参数 为 入 的 泊 松 分 布 ， 那么， 当 A 一 吕 时 ， 变 
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量 Z= (N-A) /VA 的 分 布 趋向 标准 正 态 分 布 。 
4. 如 果 例 6 -1 中 的 理赔 次 数 NN 服 从 参数 为 6 的 泊 松 分 布 ， 其 他 条 件 不 
变 ， 求 聚合 理赔 量 S 的 均值 和 方差 。 
S. 若 聚 合理 赔 模型 中 理赔 额 变 量 服 从 正 态 分 布 N(100,9)， 理 赔 次 数 NN 
的 分 布 如 下 所 示 : 
0 1 2 3 
N~ 
0.5 0.2 0.2 0.1 
求 聚 合理 赔款 8 的 均值 和 方差 。 
6. 已 知 聚 合理 赔 模 型 中 NN 服从 负 二 项 分 布 ， 参数 r=2, p=0.2。 又 已 
知 S 的 均值 和 方差 分 别 为 12.80 和 105.92。 试 确定 理赔 额 变 量 的 均值 和 
7. 如 果 第 6 题 中 的 理赔 额 变量 的 分 布 函数 如 表 6 -9 所 示 ， 计算 f(3)。 
表 6 -9 


x 1 2 3 








P (X=x) 0.50 0.40 0. 10 


8. 已 知 聚 合理 赔 量 SS 的 理赔 次 数 变 量 服从 概率 分 布 P(N=n) = 
n+2V/,1"! 

| | 人 (本 ，n =0，1，2-…， 赔 款额 变量 服从 均值 为 1 的 指数 分 布 。(1) 求 
S 的 矩 母 函数 。(2) 利用 答 母 函数 性 质 求 8 的 均值 和 方差 。 

9. 如 果 S| 服从 复合 泊 松 模型 : 参数 ,=3,p(1) =p(2) =p(3) =173， 
S, 服 从 参数 和 A, =2,，p(1) =p(2) =1/2 的 复合 泊 松 模型 ，S, 和 5, 相 互 独立 。 
试 计算 S1 + 5S, 中 理赔 额 变 量 的 分 布 。 

10. 如 果 聚 合理 赔 量 5 为 复合 泊 松 分 布 模型 ， 参 数 入 =0.06， 理 赔 额 变 
量 取 1、2 和 3 的 概率 分 别 为 0.20、0.30 和 0.50。 试 计算 S 不 小 于 3 的 
概率 。 

11. 如 果 复 合 泊 松 模 型 S 可 以 表示 为 : S=1N, +2N,+3N,， 并 且 : 

E(S) =56, Var(S) =126, E[(S—-E[S]1)’] =314 
求 : A,=E[N,], A,=E[N,],A, = E[N,]。 

12. 如 果 S 服 从 复合 泊 松 模型 ， 参数 入 =5， 已 知 理 赔 额 变量 只 取 1 或 
2， 和 且 5S 的 分 布 函 数 如 衣 6 一 10 所 示 。 利 用 例 6 -6 的 两 种 方法 和 定理 6 一 3 
计算 理赔 额 变 量 的 分 布 。 

13. 仿照 定理 6 一 3 的 证 明 过 程 证 明定 理 6 一 4。 

14. 如 果 例 6 一 6 中 的 聚合 理赔 S 服 从 复合 负 二 项 分 布 ， 参数 r=8, p= 
0.4， 其 他 条 件 不 变 。 利 用 定理 6 -4 重新 计算 $S 的 概率 分 布 函数 。 

15. 如 果菜 保险 标的 一 年 内 的 损失 次 数 服 从 参数 为 A 的 泊 … 松 分 布 ， 损 


失 额 服从 指数 分 布 f(x) =Be,x 
>0。 当 损失 发 生 时 保险 人 将 赔 表 6-10 
付 损 失 超 过 过 的 部 分 。 试 计算 : 
(1) 一 年 内 总 赔款 额 3 的 
分 布 。 
(2) S 的 均值 和 方差 。 
16. 已 知 两 类 汽车 一 年 内 的 损失 额 分 别 服 从 参数 入 , =0.3 和 入 ,=0.2 的 
复合 泊 松 分 布 ， 理 赔 额 变量 的 分 布 如 表 6 一 11 所 示 。 
按照 条 款 ， 两 类 汽车 的 免 赔 额 分 别 为 d, = 100， 






fs(x) 


表 6 一 11 








d, =150。 求 两 类 汽车 一 年 内 总 赔款 额 变量 的 Rd elves 
0.20 0.0 
矩 母 函数 、 均 值 和 方差 。 2 
50 0. 30 0. 20 
17. 对 于 聚合 理赔 模型 (6.1.1) 有 : (1) 
200 0. 30 0. 50 
NN 服从 均值 为 0.5 的 泊 松 分 布 ; (2) 理赔 额 变 
量 的 均值 和 方差 均 为 100。 定 义 损 失 率 为 一 保 “一 一 | 一 一 
1 000 0. 10 0. 10 








单 组 合 的 总 赔款 和 总 保费 的 比率 ， 已 知 相 对 安 
全 附加 费 率 为 0.1， 试 用 正 态 近似 的 方法 计算 该 模型 的 损失 率 超 过 0.75 的 
概率 。 

18. 用 平移 人 徊 玛 分 布 近 似 方法 估计 聚合 理赔 款 3 的 分 布 ， 已 知 : xo =0， 
E[S] =j,Var(S) =o ,ET(S-A) ] =v。 试 用 J 和 0 表示 v。 

19. 假设 S 服 从 参数 r=6 及 p=1/4 的 复合 负 二 项 分 布 ， 理 赔 额 服从 指 
数 分 布 (密度 函数 为 :3e “,， x>0 )， 试 分 别 用 正 态 近似 和 平移 伽 玛 分 布 计 
算 PLS<8}。 

20. 分 别 按照 个 别 理赔 模型 和 两 种 近似 的 复合 泊 松 模型 对 例 6 -13 计算 
F(x) =PIlS<4|。 

21. 某 保 险 公 司 对 2 250 个 投保 人 提供 医疗 费用 保险 ， 其 分 布 如 表 6 一 12 
所 示 。 每 张 保单 最 多 理赔 一 次 ， 总 理赔 额 可 以 用 复合 泊 松 分 布 近 似 。 拟 合 的 
复合 泊 松 分 布 和 个 别 凤 险 模 型 的 期 望 损失 次 数 相 同 ， 发 生 损 失 时 个 别 理赔 额 
的 分 布 也 相同 。 试 用 复合 泊 松 分 布 模型 求 理赔 总 量 方差 的 近似 值 。 











表 6 -12 
保单 类 别 被 保险 人 数 理赔 概率 理赔 分 布 
1 1 500 0.01 | 在 (0, 1) 上 均匀 分 布 
2 750 0. 02 在 (0，2) 上 均匀 分 布 
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了 解 如 下 概念 : 副 余 过 程 、 总 理赔 过 程 、 泊 松 过 程 、 破 产 概 率 、 最 
大 总 损失 过 程 、 调 节 系 数 、 布 朗 运动 以 及 净 现 金 流入 过 程 

了 解 寻 找 破产 概率 的 四 类 方法 

了 解 调节 系数 在 确定 最 优 再 保险 中 的 作用 

口 熟悉 连续 时 间 破 产 概率 的 精确 计算 与 近似 计算 

口 熟悉 离散 时 间 破 产 概率 的 计算 

口 掌握 并 能 运用 各 种 方法 计算 破产 概率 





























57.1 盈余 过 程 与 破产 概率 


7.1.1 弄 余 过 程 
我 们 从 影响 保险 人 稳定 经 营 最 重要 的 方面 一 一 资产 和 人 负债 人 手 。 资 产 
与 负债 的 差额 ， 一 般 称 为 盈余 ， 简 记 做 : 
U(t) =A(i) -L(t), t 宇 0 (7.1.1) 
其 中 4(1) 表示 时 刻 1 的 资产 ,L(t) 表示 时 刻 上 的 负债 ,上 =0 时 刻 的 盈余 
被 称 为 初始 盈余 、 初 始 资 本 或 初始 准备 金 ， 简 记 为 w， 即 : U(0) =z。 
现实 中 的 4(5 和 L(t) 是 非常 多 样 化 的 ， 各 个 保险 公司 不 同 的 保险 经 
营 模 式 和 资产 管理 都 会 对 应 不 同 的 资产 负债 价值 过 程 。 作 为 一 个 初步 的 理 
论 模 型 ， 这 里 将 对 实际 情况 作 较 大 的 简化 ， 这 里 的 负债 部 分 只 考虑 保险 合 
同 产 生 的 理赔 ， 资 产 部 分 则 主要 考虑 保费 收入 ， 并 且 完 全 忽略 对 利率 、 投 
资 收益 率 、 通 货 膨 胀 、 运 营 费 用 和 保单 红利 等 等 因素 的 考虑 。 传 统 的 风险 
理论 对 保费 收入 过 程 还 有 进一步 的 简化 ,假设 保费 收入 按照 固定 的 比例 。 
线性 增长 ， 在 现实 中 < 为 年 保费 收入 。 综 上 所 述 ， 传 统 的 古典 盈余 过 程 模 
型 为 : 
U(t) =wu+ct — S(t), t=0 ; u>=0,c>0 (7.1.2) 
这 是 一 个 以 w 为 初 值 、 以 时 间 为 指标 集 的 随机 过 程 。 
在 模型 (7.1.2) 中 ，1{5(:t),: 宇 0} 被 称 为 总 理赔 过 程 ， 它 表示 从 0 
到 上 上 时刻 发 生 的 所 有 理赔 之 和 ， 因 此 ， 它 是 一 个 取 值 非 负 的 以 时 间 为 指标 
集 的 随机 过 程 ， 又 简称 为 理赔 过 程 。 显 然 ， 模 型 (7. 1.2) 最 核心 的 部 分 是 
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理赔 过 程 。 按 照 与 第 五 章 、 第 六 章 类 似 的 研究 思路 ， 总 理赔 过 程 1S(z) ， 
i 宇 0| 由 理赔 次 数 和 每 次 理赔 额 复合 而 成 ， 所 以 有 如 下 的 总 理赔 过 程 表 达 : 


十 省 十 二 NG >0 


SCi) = (7.1.3) 
0 


N(i) =0 
其 中 : 

1. N(i) 表示 [0, it] 内 的 总 理赔 次 数 ， 取 值 非 负 整 数 ， 且 N(0) =0， 
称 {N(i)，t 宇 01 为 理赔 次 数 过 程 (claim number process ) ; 

2. 当 N(i) =n>0 已 知 时 , 站 ,zi=1，2，…，, 灵 表示 [0, 1] 内 第 i 次 
理赔 的 金额 ; 与 第 六 章 类 似 仍然 称 之 为 理赔 额 变量 ，; 

3. S(1)，t 宇 0 表示 
[0, 1] 内 的 总 理赔 额 ， SG 
且 5S(0) =0。 

由 式 (7.1.3) 定义 
的 总 理赔 过 程 {5(1), : XtX 
宇 0| 是 对 理赔 的 一 种 累 
积 过 程 ， 在 新 的 理赔 发 
生 时 都 会 使 总 理赔 额 产 | 
生 一 个 跳 晓 ， 而 在 第 i 次 7 z, T t 
理赔 与 第 i+1 次 理赔 之 
间 ，S (1) 为 常数 。 图 图 7-1 总 理赔 过 程 1S (4) ，t 二 01 的 轨道 
7 -1 形象 地 说 明了 {S(z) ， 
t 宕 01 过 程 的 轨道 特点 。 


XtXt AX 


xX 一 一 一 


7.1.2 破产 概率 

从 盈余 模型 (7.1.2) 看 ， 一 方面 是 连续 不 断 的 保费 以 速度 c 进行 积 
累 ， 另 一 方面 则 是 不 断 地 会 有 理赔 需要 支付 ， 形 成 跳 芭 的 支出 ， 琴 此 盈余 
过 程 也 是 一 个 跳跃 的 上 升 变 化 过 程 。 在 两 次 理赔 之 间 ， 和 盈余 按照 比例 。 线 
性 增长 ， 一 旦 遇 到 理赔 发 生 时 ， 散 余 立 即 (瞬时 ) 按理 赔 额 水 平 降低 。 而 
且 ， 著 某 一 时 刻 发 生 了 数额 很 大 的 理赔 ， 就 很 有 可 能 马上 出 现 一 余 小 于 零 
的 情况 ,通常 人 们 形象 并 有 点 硅 张 地 称 这 个 事件 为 “破产 ”。 

虽然 在 现实 中 发 生 这 种 V(t) <0 的 情况 并 不 一 定 意味 着 保险 公司 马上 
会 倒闭 ， 可 能 也 只 是 说 明 保 险 人 需要 及 时 追加 资金 来 应 付 突然 的 保险 责任 ， 
也 许 在 考虑 了 其 他 许多 因素 后 ,保险 人 的 财务 状况 并 非 很 糟 。 但 是 ,在 简 
化 的 熏 余 模型 中 对 这 种 破产 事件 进行 研究 无 疑 是 非常 有 意义 的 ， 它 对 保险 
公司 考虑 财务 预警 系统 以 及 对 保险 监管 部 门 设 计 某 些 监管 指标 系统 等 问题 
有 直接 的 参考 指导 作用 。 
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以 上 关于 破产 的 直观 感觉 可 以 用 下 面 的 一 系列 数学 概念 表述 : 
定义 7-1 破产 时 刻 (ruin time) 。 称 僵 余 过 程 (7. 1.2) 的 如 下 随机 
变量 
T=inf{i: t=0, U(t) <01 (7. 1.4) 
为 该 盈余 过 程 的 破产 时 刻 。 实 际 上 ,7 为 盈余 首次 出 现 负 值 的 时 刻 。 
定义 7-2 终极 生存 概率 (survival probability) 。 称 


bl(u) =P(U(t)=0, Vit=0) (7.1.5) 
为 终极 生存 概率 。 
定义 7 -3 终极 破产 概率 (ruin probability ) 。 称 
yu) =1-eo(z) =P( 3t20,U(t) <0) (7.1.6) 


为 终极 破产 概率 。 由 终极 破产 概率 的 定义 还 可 知 水 (xx) =P(T<c )。 

由 于 式 (7.1.6) 中 定义 的 终极 破产 概率 没有 时 间 上 限 ， 因 此 也 称 为 无 
限时 间 破 产 概率 。 但 在 现实 中 由 于 保险 公司 往往 关注 的 是 在 茶 一 确定 时 期 
比如 在 5 年 、10 年 或 20 年 之 内 的 经 营 状 况 ， 所 以 需要 考虑 有 限时 间 内 的 破 
产 概 率 。 

定义 7 -4 有 限时 间 破 产 概率 。 称 

yu,t) =P( dse(0,t1,U(s) <0) (7.1.7) 
为 该 盈余 过 程 在 时 间 (0, it] 内 的 破产 概率 ， 即 朋 余 过 程 在 有 限时 间 内 破 
产 的 概率 。 

由 定义 7-4 可 知 有 限时 间 破 产 概率 yy(u, 1t) =P(T<i), 即 y(wu, i) 
= F(t)o 

破产 概率 y(u) 及 y(u, it) 满足 以 下 的 基本 性 质 ， 请 读者 自己 练习 
验证 。 . 

性 质 7 -1 对 于 zw 二 已 和 0 < 与 去 吉 < oo ， 有 以 下 结论 成 立 : 

(1) yw,t) yu,t), Vt>0; 

(2) yu) sy ); 

(3) ylu,a) yu,t) yu), 

(4) limy(u,t) =y(u) 

【 例 7-1】 设 某 保 单 组 合 的 理赔 在 0<i<7 时 间 段 中 的 记录 如 表 7 -1 
所 示 ， 又 设 保险 人 的 初始 青 余 uw =5， 保 费 收 入 比例 c=4。 试 描述 该 保单 组 
合 在 这 段 时 间 内 的 盈余 变化 情况 。 


表 7-1 某 保单 组 合 的 理赔 记录 
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解 : 表 7 -1 记录 的 是 总 理赔 过 程 一 条 样本 轨道 的 变化 情况 : 


0 ， 0O<i<0.5 

pA 0.5<i<2 

12.5， 2 和 上 <2.75 
s(t) = 

19. 5 ， 2.73 生 上 <4 

23. 3 ， 4 三 上 <6 

35.5,， 6 it7 


这 里 用 s(:) 表明 它 是 S(1) 的 一 条 轨道 ， 它 描述 了 理赔 过 程 (7.1.3) 的 
一 种 情况 。 
对 应 于 上 述 总 理赔 过 程 轨道 的 番 余 过 程 的 轨道 为 : 


5+4z:, 0 三 上 <0.5 
5+4:—-2.5, 0.5<: <2 
ee a 
5+4t~—19.5, 2.75<i<4 

5 +4it -23.5, 4<i<6 

5 +4:—35.5, 6 一 上 < 和 7 
5 +41， 0 三 上 <0.5 
2.3 +41， 0.5<i<2 
~7.5+4i, 2<i<2.75 
一 14.3 +4i, 2.75<t<4 

一 18.3 +4:, 4<i<6 

— 30.5 +4:, 6 二 上 < 生 7 


它 描述 了 盈余 过 程 (7.1.2) 的 一 条 轨道 ， 其 变化 如 图 7 -2 所 示 。 从 图 
7 -2 中 可 以 看 出 , 在 上 =2.75 时 ， 轨 道 第 一 次 落 到 i 轴 之 下 ， 也 就 是 说 在 
=2.75 时 发 生 破产 。 

【 例 7 -2】 设 保险 人 对 于 某 类 保单 设置 的 初始 盘 余 为 10 万 元 ， 估 计 
年 内 将 以 每 份 5 000 元 的 价格 售 出 100 张 这 类 保单 。 假 定 每 张 保单 是 否 发 生 
理赔 是 相互 独立 的 ， 总 理赔 费用 占 总 保费 P 的 20%。 又 假定 该 类 保单 组 合 
n 年 的 总 理赔 S(n) 用 均值 为 0.7P、 方 差 为 2P 的 正 态 分 布 近 似 ， 其 中 尸 表 
示 年 保费 总 收入 。 为 了 在 每 年 末 评 估 保 险 人 的 盈余 状况 ， 试 计算 该 公司 在 
第 一 年 末 出 现 负 僵 余 的 概率 。 

解 : 为 简化 计算 ， 下面 以 1 万 元 为 一 个 货币 单位 ， 设 初始 到 余 为 wu， 第 
一 年 的 理赔 额 为 5S(1)， 依 题 意 ， 有 w=10,， P=100 x0.5， 则 该 公司 在 第 一 
年 末 的 盘 余 为 : 

U(1) = 初始 登 余 + 第 一 年 的 保费 收入 -第 一 年 的 理赔 费用 -第 一 年 的 理赔 

=u+P-0.2P-S(1) =10 +100 x0.5 -0.2x100 x0.5-S(1) 
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图 7-2 例 7-1 的 盈余 过 程 轨道 示例 四 
=50-S(1) ; 
经 计算 ， 有 S(1) ~NV(35,10) ， 因 此 ， 第 一 年 年 末 出 现 负 到 余 的 概率 为 : 
50 -35 
P{U(1) <0} =P{S(1) =50) =-1-%(—0 | 
=1-@(1.5) =1 -0.93319 =0. 067 


【 例 7-3】 承 上 例 ， 考 虚 第 二 年 的 情况 。 假 定 第 二 年 内 能 够 再 售 出 
200 张 同类 保单 ， 试 计算 第 二 年 末 峡 现 负 一 余 的 概率 。 

解 : 这 时 ,P= (100 +200) x0.5 =150， 同样 可 得 保险 人 在 第 二 年 末 的 
盈余 为 : U(2) =130 - 5(2)。 而 5S(2) ~N(105 ,17.3’)， 第 二 年 末 出 现 负 
盈余 的 概率 为 : 


P{U(2) <0} =P{S(2)=130} =1 -和 1 


=1—@(1.443) =0.074 是 

”从 上 面 的 两 个 例子 可 以 看 出 ， “破产 ”是 一 个 非常 多 义 的 词汇 ， 在 例 

7 -3 中 只 考虑 了 第 二 年 末 出 现 负 盈余 的 情况 ， 与 例 7 -2 的 情形 无 关 ， 这 两 
个 例子 都 只 是 计算 了 一 个 国定 点 的 盘 余 情况 。 

正如 “破产 ”这 个 词汇 的 字面 含义 所 强调 的 ， 了 解 这 个 不 利 事件 发 生 

的 概率 具有 特别 重要 的 意义 。 因 此 ， 本 章 的 主要 任务 之 一 就 是 要 在 各 种 条 
件 下 获得 关于 一 余 过 程 破产 和 破产 概率 的 性 质 。 


130 — 3 


$7.2 总 理赔 过 程 
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通过 上 面 的 分 析 ， 我 们 知道 盈余 模型 (7. 1.2) 最 重要 的 部 分 是 总 理赔 
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过 程 (7. 1.3)， 总 理赔 过 程 (7. 1. 3) 又 由 理赔 次 数 过 程 {N(Ci) ,i 二 0} 和 
理赔 额 变量 闭 复 合 而 成 。 本 节 将 分 别 对 理赔 次 数 过 程 和 总 理赔 过 程 的 基本 
性 质 进行 讨论 。 





7.2.1 理赔 次 数 过 程 一 一 泊 松 过 程 

理赔 次 数 过 程 是 上 所谓 计 数 随机 过 程 的 特例 。 

定义 7-5 随机 过 程 {N(:) ，it 宇 01 被 称 为 计数 随机 过 程 ， 若 

(1) 取 值 为 非 负 整 数 ， 且 N(0) =0 ; 

(2) 样本 轨道 为 阶梯 形 ， 每 次 增加 1。 

若 计数 过 程 是 记录 了 某 种 事件 发 生 的 次 数 ， 那 么 由 计数 过 程 的 定义 知 ， 
在 充分 小 的 时 间 区 间 内 ， 至 多 发 生 一 次 事件 。 为 了 刻画 计数 过 程 ， 有 时 可 
以 考虑 以 下 的 三 种 描述 方法 : 

方法 一 : 对 任意 :=0, h>0,， 有 P(N(i+h) >N(i) +1|N(s),0 <s< 
1) =o(h) 


方法 二 : 对 任意 :>0， 考 虑 lim PLNGs + Ab _N(t) =1|N(s),0 <s 


和 如 ， 记 该 极限 〈 若 存在 ) 为 A(t;)， 称 为 计数 过 程 的 强度 函数 。 则 计数 过 
程 为 在 时 间 区 间 [:, :+Ai] 内 ， 发 生 一 次 事件 的 概率 为 和 A(:) A:， 事件 不 
发 生 的 概率 为 1 -和 A(t)At， 发 生 两 次 以 上 事件 的 概率 为 ol Ai)。 
方法 三 : 对 任意 :=0， 当 N(1) >0 时 ， 记 : 
T,=inf jc>7 NO > N(T,)} E=1)2， NO (7.2.1) 
则 有 
0=T, <T,<T,<: < 了 vco 
依次 表示 [0, i] 上 各 次 事件 发 生 的 时 刻 ， 且 有 
W,=T,-T,,, i=1,2,..…,N(i) (7. 2. 2) 
表示 两 次 事件 之 间 的 时 间 间 隔 ， 一般 称 为 等 待 时 间 (waiting time) 变量 ， 
黎 ; 为 非 退 化 的 取 非 负 实 值 的 随机 变量 。 
图 7 -3 是 对 理赔 次 数 过 程 {N wo 
(i:),，i 宕 01 的 直观 描述 ， 其 中 也 ， 
7T,，-… 表示 各 次 理赔 发 生 的 时 刻 。 计 
数 过 程 的 轨道 除 T,，7T,，… 点 外 是 连 
续 的 ， 而 且 在 这 些 间 断 点 右 连 续 、 左 
极限 存在 。 
最 常见 的 计数 过 程 是 泊 松 〈 计 
数 ) 过 程 ， 可 以 用 定义 7 -6、7 -7 来 图 7-3 理赔 次 数 过 程 [N(t)，t>01 示例 
定义 泊 松 过 程 : 


心 ID 、w 
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程 ， 若 : 

(1) 独立 增 量 ， 即 对 任意 的 0 <s <1<v <w， 随 机 变量 N(i) - N(s) 与 
N(w) - N(v) 独 立 ; 

(2) 平稳 增 量 ， 即 对 任意 t 宇 0， hh >0，N(t+h) - N(1) 的 分 布 只 与 区 
间 长 度 及 有 关 ; 

(3) N(1: +h) ~ N(i) ~ Poisson( Ah), 

定义 7-7 计数 过 程 1N(i) ，t>0} 被 称 为 强度 参数 为 4 的 泊 松 过 
程 ， 若 : 

(1) 独立 的 平稳 增 量 ; 

(2) 对 任意 h>0， 有 P(N(h)=1)=Ah+o(h); 

(3) 对 任意 h>0， 有 P(N(h) 宇 2) =o(h)。 

独立 增 量 意味 着 任意 区 间 内 的 索赔 次 数 与 之 前 任意 与 其 不 相交 的 区 间 
内 的 索赔 次 数 互相 独立 ， 而 平稳 增 量 则 说 明 固定 区 间 内 的 索赔 次 数 只 依赖 
于 区 间 长 度 ， 与 起 始 位 置 无 关 ， 如 不 受 时 间 趋 势 的 影响 。 若 一 个 随机 过 程 
同时 满足 平稳 性 和 独立 性 ， 则 独立 的 平稳 增 量 过 程 就 可 以 看 做 是 从 任 一 时 
刻 开始 的 原 过 程 。 事 实 上 ， 定 义 7 -6 中 的 条 件 (3) 和 定义 7 -7 中 的 条 件 
(2)、(3) 已 经 暗含 了 平稳 独立 增 景 的 性 质 。 因 此 ， 平 稳 独 立 增 量 的 假设 
只 是 为 了 更 强调 这 一 性 质 ， 从 而 使 定义 的 阐述 更 加 明确 。 另 外 ， 定义 7 -6 
中 的 条 件 (3) 和 定义 7 -7 中 的 条 件 (2)、(3) 是 等 价 的 ， 请 读者 自行 
证 明 。 

下 面 我 们 不 加 证 明 地 列 出 关于 泊 松 过 程 的 两 个 进一步 的 结论 : 

(1) 对 任意 的 :二 0， 当 已 知 N(t) =n 的 信息 时 ， 随 机 向 量 (7T,,， 7,， 

，T,) 与 n 个 独立 的 且 服 从 区 间 [0,:] 上 均匀 分 布 的 随机 变量 形成 的 
次 序 〈 按 从 小 到 大 排序 ) 统计 量 的 随机 向 量 同 分 布 ， 即 : 

万 tsb | NG) =n) = 于， i 

(2) 当 了 ,= 及 所 有 N(s) ，s<t 的 信息 已 知 时 ， 由 式 (7.2.2) 定义 
的 等 待 时 间 到 为 (条 件 ) 独立 同 分 布 的 随机 变量 序列 ， 且 共同 分 布 是 均值 
为 174 的 指数 分 布 ， 其 中 4 为 泊 松 过 程 的 强度 参数 。 


车 聚合 理赔 过 程 (7. 1.3) 中 的 理赔 次 数 过程 1N(i) ，i 宇 01 为 泊 松 过 
程 ， 则 称 式 (7. 1.3) 为 复合 泊 松 过 程 。 为 强调 起 见 ， 这 里 对 复合 泊 松 过 程 
再 次 给 出 完整 的 定义 。 

定义 7-8 式 (7.1.3) 的 总 理赔 过 程 15(:),， :0} 称 为 复合 泊 松 过 
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程 ， 若 : 

(1) 计数 过 程 {N(t)，t 宇 01 是 强度 参数 为 A 的 泊 松 过 程 ; 

(2) {X;, i=1,2，,，…| 是 独立 同 分 布 的 随机 变量 序列 ， 共 同 的 分 布 函 


数 记 为 F(x*)、 密 度 函 数 记 为 八 x),，X 的 & 阶 原点 矩 (车 存在 ) 记 为 p,, 上 
=0， 1 ， 9 

(3) [VC ，t20 与 1， =1，2，…} 独立 。 

复合 泊 松 过 程 具有 以 下 基本 性 质 : 

(1) 平稳 ， 独 立 增 量 ， 即 对 任意 取 定 的 :二 0, h>0，S(t+h) -S(t) 与 
> Oe 0 Ce N(h) >0 
| N(h) =0 
同 分 布 ， 其 共同 分 布 为 复合 泊 松 分 布 : 泊 松 参数 为 Ah， 理 赔 额 变量 的 分 布 
函数 为 F(x)。 

(2) 经 过 简单 的 计算 ， 复 合 泊 松 过 程 的 特征 变量 为 : 


S(h) = 


EL S(1) ] =AtwE(X) = Aip, (7.2.3) 
Var[ S(1) ] = AtE(X’) = Aitp, (7.2.4) 
Mss(r) =e*%…" 中 1 且 属于 Mi(7) 的 定义 域 (7.2.5) 


其 中 My(r) 为 理赔 额 变 量 环 的 矩 母 函 数 。 

(3) 过 程 的 轨道 除 7,，7,，… 点 外 是 连续 的 ， 而 且 在 这 些 间 断 点 右 连 
续 、 左 极限 存在 。 当 7, 已 知 时 ，S(7,) -SC7 -0) 与 大同 分 布 。 

在 总 理赔 过 程 是 复合 泊 松 过 程 的 基础 上 ， 可 以 进一步 考虑 相应 的 一 余 
过 程 ， 这 也 是 传统 的 古典 破产 理论 结论 最 多 的 盈余 模型 。 

定义 7-9 称 下 面 的 过 程 {U(:)，t 宇 0| 为 (连续 时 间 ) 泊 松 盈余 过 
程 (surplus process): 

Zi) =u tct ~ S(t), 1 三 0 

其 中 : 

(1) zv 为 初始 盈余 ，vz0 ; 

(2) {S(z)，s 宇 0 为 复合 泊 松 过 程 ， 泊 松 参数 和 ， 理 赔 额 变量 瑟 ~F(xz); 

(3) c 为 单位 时 间 内 收取 的 保费 ， 满 足 c=(1+0)Ap，9>0 

对 于 泊 松 盈余 过 程 ， 有 以 下 的 基本 结论 : 


EL[U(1:)] = 五 [zt+cet-SCi)]=L+OAPE (7.2.6) 
Var[ U(#) |] = Var[ S$S(1)] = Ap,t (7.2.7) 
Mi (7) SN (7. 2. 8 ) 


从 式 (7.2.6) 和 (7.2.7) 可 以 看 出 泊 松 盈余 过 程 的 均值 和 方差 都 是 上 的 
线性 晃 数 。 由 于 6>0， 则 有 

limE[ U(z)] = lim(w + OApt) =+% (7.2.9) 
进而 通过 一 定 的 推导 ， 有 
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limy(u) =0 (7. 2. 10) 
这 表明 : 只 要 保费 收入 超过 平均 损失 ,保险 人 的 长 期 利益 就 得 到 了 充分 的 
保障 。 但 是 在 短期 经 营 中 ， 可 能 会 因 理赔 的 随机 性 出 现 大 量 理赔 集中 发 生 
的 情况 ， 使 得 保险 人 的 财务 暂时 出 现 赤 字 ， 发 生 破 产 。 


$7.3 连续 时 间 终极 破产 梳 率 的 计算 


经 过 前 面 的 准备 ,这 一 节 我 们 开始 讨论 满足 一 定性 质 的 盈余 过 程 
(7. 1.2) 的 破产 概率 。 这 里 的 讨论 都 是 基于 定义 7 -9 的 泊 松 盈余 过 程 进行 
的 ， 对 这 个 古典 盈余 过 程 破产 概率 的 研究 ， 主 要 围绕 微 积 分 方程 、 最 大 总 
损失 和 调节 系数 三 个 技术 方法 进行 。 


7.3.1 微分 方程 式 与 破产 概率 

本 节 将 对 复合 泊 松 僵 余 过 程 寻 出 关于 破产 概率 y(w) 的 微 积分 方程 式 ， 
并 对 理赔 额 变 量 X 的 某 种 特殊 情形 求解 方程 ， 进 而 得 到 WwW(w) 的 显 式 解 。 

定理 7 -1 对 于 泊 松 盈余 过 程 ， 破 产 概率 少 (z) 满足 以 下 的 微 积分 
方程 ; 


bi(z) = ya) -人 [yz -aae(z) -和 [1 -Pa)] 必 >0 
【49 c 0 c 

(7. 3.1) 
Vy = wr dt -PCz)]dz+ 人 人 Ee 


(7.3.2) 
其 中 ,， F(x) 为 理赔 额 变 量 蕊 的 分 布 函数 。 特 殊 地 ， 有 


1 
%(0) 1+0 


”证 明 : 首先 证 明 式 〈7. 3. 1) 。 考 虑 在 充分 小 的 时 间 (0，Ait] 内 至 多 发 

生 一 次 理赔 ， 所 以 ， 下 面 按照 是 否 发 生理 赔 两 种 情况 讨论 : 

1. 在 (0，4i 内 没有 理赔 ， 概 率 为 1 -AAt。 在 时 刻 At 的 鼻 余 为 w+ 
cAt， 而 且 由 泊 松 过 程 的 独立 增 量 性 ， 这 时 的 破产 概率 为 jy (wu +cAt)。 

2. 车 (0，Ai] 内 发 生 一 次 理赔 ,概率 为 AAt， 若 理赔 额 为 x， 则 发 生 
该 理赔 额 的 瞬间 概率 为 4F(x)。 可 进一步 讨论 在 时 刻 At 之 前 破产 或 不 破产 
两 种 情形 : 

(1) 在 (0，Ai 内 未 破产 ， 即 ; 0<x<<u +cAt。 在 时 刻 Ai 的 盈余 为 zx 
+cAt -x， 而 且 由 泊 松 过 程 的 独立 增 量 性 ， 这 时 的 破产 概率 为 yy(u+cAt- 
x) ， 当 x 取 值 于 整个 (0, w+cAit] 时 ， 则 


二 CA 


[ yu + cAt — x)dF(x) 





(7.3.3) 


表示 破产 概率 的 累加 结果 。 

(2) 在 (0，Ai] 内 破产 ， 即 : x >vw+cAt。 则 1-Rvz+cAl) 表示 所 
有 这 类 事件 的 总 概率 。 

总 结 上 面 的 两 种 情况 ， 有 


pu) = (1 -AADUCz +cAD + aa [|[ vr + cAt x) dF(x) 


+1 -Flu+eAt) | 


整理 上 式 ， 得: 


et A we 三 Sylu + cA:i) -A yr + cAt — x)dF(x) 
-全 [1 _ F(u +ecAb)] 


令 Ai 一 0， 则 txz) 存 在 且 式 (7.3.1) 得 证 。 
下 面 证 明 式 (7. 3.2)。 将 式 (7.3.1) 两 边 积 分 ， 有 


[wa = Sf wv) a -全 | fw — x)dF(x)dv 
-| [1 F(x) Jdx 
虽 ] : 


yD) -4(0) = 全 | wz- 全 | vo)ddr(x) -全 | [PCa]dz 


全 仆 yo) dv - Ee yw) dvF (x) 





, + wu -PCD)dz] 
-| [1- F(x)1dx} 
-全 人 we- -| yu -a) Flr)dz -| [1 ~ P(x) dx} 
{| yw — x) [1 - F(x)]dx -人 [1 - F(x) 1dx} 
上 述 推导 过 程 采用 了 分 部 积分 方法 和 已 知 条 件 F(0) =0。 即 : 
ylu) = wy(0) + yu — x)[1 —- F(x)]dx 


-fi F(x) Jax! (7. 3.4) 
令 xz 一 co ， 由 式 (7.3.4) 有 
0 = y(0) + Ef{lim(f wo —«)[1 -P(x)1ds) 
-| [1 ~ F(xz)]ax] 
另外 ， 可 以 证 明 : 
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lim ( (f yx)dx) = = lim ( (f 水 (z x) F(x) dx) 


则 有 
Re ky 
(1 + 90) 


由 此 ， 式 (7.3.3) 得 证 ， 再 将 上 式 代 人 式 (7.3.4) 可 得 式 (7.3.2) 的 
结论 。 下 

虽然 定理 7 -1 得 到 了 破产 概率 的 微 积 分 表达 式 ， 但 要 获得 式 (7. 3. 1) 
的 解 y(u) 的 解析 表达 式 并 不 容易 ， 只 有 一 些 特 殊 的 情形 才 会 得 到 这 种 表 
达 式 。 

定理 7 -1 的 式 (7.3.3) 具有 特别 的 含义 ， 即 在 初始 资金 为 零 的 情况 
下 ， 所 收取 的 保费 不 够 支付 理赔 的 概率 。 从 式 (7.3.3) 可 看 出 ， 这 个 概率 
仅 与 附加 保费 率 有 关 ， 与 理赔 次 数 过 程 的 参数 A 和 理赔 额 的 分 布 F(x) 
无 关 。 

定理 7 -2 设 在 泊 松 盘 余 过 程 中 ， 理 赔 额 变 量 服从 均值 为 1/a 的 指数 
分 布 ， 则 破产 概率 为 : 


wy(0) = 全 | [1- Fr)]dr = Ap, = 





2 三 0 (7.3.5) 
证 明 : 将 F(x) =1--e“ 代 人 式 (7.3.1)， 可 得 : 
yy’'(u) = 全 bu ) - “2。 - 「 ey (x) dx -全 =0 (7.3.6) 


方程 (7. 3.6) 两 边 求 导 ， 有 





vy"(u) = wy’( CM o p(x) dx — Mey(u ) + eo",u>0 
(7.3.7) 

将 (7. 3.6) 两 边 同 乘 a 后 与 (7.3.7) 相 加 ， 得 : 
yy") + (a-)w' Cw) =0， vv 之 0 (7.3.8) 


另 由 c=(1+0)Api，9>0， 则 


Se 





C 1+0 
所 以 ， 微 分 方程 (7. 3. 8) 的 通 解 为 : 


Ee 
其 中 和 大 为 任意 常数 。 为 了 确定 这 两 个 任意 常数 ， 分 别 令 4=0 和 ww ， 
得 如 =0 和 及 = 几 (0) ， 因 此 有 : 


a0 1 
e 一 1+8 2EO0 [1 


1 ge ? 
定理 7-3 对 于 泊 松 一 余 过 程 ， 当 胡 余 首次 降 至 初始 航 余 uw 以 下 时 ， 





yu) = 
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其 当时 盈余 的 负 值 (一般 称 为 亏损 变量 deficit) 的 概率 密度 为 : 
Pluty< -UT) cutytdy|T<m) -tT dy, y 宇 0 
(7.3. 9) 
其 中 F(y) 是 理赔 额 变量 的 分 布 函 数 。 
该 定理 的 证 明 过 程 与 定理 7 -1 的 证 明 方 法 类 似 ， 但 是 有 一 定 的 难度 ， 
这 里 略 去 其 证 明 ， 读 者 可 查阅 参考 文献 (Bower etc，1997 ) 。 
定理 7 一 3 的 含义 同样 在 于 只 考虑 所 收取 的 保费 不 够 支付 理赔 的 概率 ， 
而 不 关心 初始 的 盈余 水 平 ， 因 为 对 于 某 种 具体 的 保险 业务 来 说 ， 开 始 很 难 
确定 究竟 要 给 它 分 配 多 少 初始 资本 。 所 以 ,不 考虑 初始 盈余 ， 单 单 分 析 保 
费 不 够 支付 理赔 的 概率 也 具有 很 重要 的 意义 。 
由 于 | [1 - PCy)]dy = pl， 所 以 ， 
1 -FC(y) i 
pi 
可 看 做 是 某 个 随机 变量 的 概率 密度 ， 我 们 一 般 用 L, 表示 这 类 随机 变量 。 它 
相当 于 是 对 随机 变量 天 的 分 布 进 行 的 变换 ， 这 种 变换 在 风险 理论 讨论 中 很 
有 意义 。 由 式 (7.3. 10) 的 定义 ， 经 过 简单 的 计算 可 以 得 到 工 的 矩 母 函数 
(车 存在 ) 的 表达 式 : 


f.(y) = y 宇 0 (7.3.10) 


M, (7) = Mir) -1)， r 宇 0 (7.3.11) 


7.3.2 最 大 总 损失 与 破产 概率 
当初 始 盈 余 为 二 时， 盈余 过 程 (7. 1.2) 的 终极 生存 概率 为 : 
$b(u)=P(T=%) =P(U(t) =0, Viti>0) 
=P(S(1) ~- cit<u, Vit>=0) =P(max[ S(t) —ct|<u) 
定义 7-10 盈余 过 程 {1U(t),，t 宇 01 的 最 大 总 损失 (maximal aggregate 
loss) 随机 变量 为 : 
L= maxl S(z) 一 ct 
当 09>0 时 ， 有 
lim( S(z) 一 ci) = 一 oo 
自然 有 L 宇 0 ,而且 对 任意 的 uw 二 0， 有 
yu)=1-P(L<u)=1-F(u)>0 
利用 最 大 总 损失 变量 的 上 述 定义 ,我 们 可 以 得 到 关于 这 个 变量 的 一 些 性质 
和 结论 。 
定理 7-4 车 {5(t)，t 宇 0} 为 复合 泊 松 过 程 ， 则 有 以 下 结论 成 立 : 


(1) yu) =1- 5 (TH) (TO)ri Ce) (7. 3. 12) 





" 125: 


人 > 
Orp， 
(2) M.(r) = + (1+0)rp, —- M,(r) 
9 1 6[ M;(r) -1] 


三 EP A 三 0 7. 3. 
1+0'1+0 1+(1+0)rp, -~ M.(r)’ 和 (7. 3. 13 ) 


其 中 万 的 定义 见 (7.3.10)。 
证 明 : 考虑 如 下 的 随机 序列 : 
(1) S(t) -ct 的 第 k( k 宇 0 ) 次 记录 产生 的 时 刻 为 : 


T= inf {255(1) ~ ot > Doss T,=0 
元 相当 于 以 ZL 为 初始 葵 余 的 一 余 过 程 首次 低 于 L, 的 时 刻 。 
(2) SC) -ct 第 k( k 宇 0 ) 次 记录 的 值 为 : 
L,=S(T,) -eT,L,=0 
利用 泊 松 过 程 的 性 质 可 以 证 明 : 最 大 总 损失 工 可 以 表示 为 : 
五 三 万 十 天 t+L, 
其 中 : 
Q@N 表示 S(t) -ct 在 te[0, %] 的 轨道 上 破 记录 (“破产 ”) 的 总 数 ， 
则 
P(N=n) =P(n 次 “破产 ”, 一 次 不 “破产 ”) =y"(0)[1 -yw(0)] 


_/_ 1 1 8 
Sg [| 
N 服从 参数 为 已 = 二 “的 几何 分 布 。 
轩 二 表示 两 次 记录 的 差 值 ， 也 就 是 前 面 讨论 过 的 亏损 变量 ， 所 以 随机 





变量 列 1 = 无 -三 nmn=1,， 2，…} 独立 同 分 布 ， 共 同 的 分 布 为 f, (%)。 
然后 按照 复合 分 布 的 定义 自然 有 : 


yu) =1-F(u)=1-— 六 RCR = n) Fi"(u) 


a 3(i er fo) re) 


n=0 








Me(D = Mallog M. (7)) -TO 
将 式 (7.3.11) 代入 ,有 
Orp， 
1+(1+0)m -MC(r)’ 
经 过 适当 的 整理 ， 上 式 与 式 〈7.3.13) 相同 。 
式 〈7.3. 13) 表明 最 大 总 损失 工 服 从 如 下 的 混合 分 布 : 


0 
A 


Fr 之 0 


M,(r) = 
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MD 
1+(1+0)m — M,.(r)” 


【 例 7-4】 若 X~-Pareto (a, B6), a>1,B>0, 当 9=0.2; a =3， 
B=1 000 时 ， 计算 破产 概率 。 
解 : 由 已 知 


L>0 部 分 的 矩 母 郴 数 为 : 





则 有 


所 以 , Li ~ Pareto (a -1, B6)。 我 们 对 初始 盈余 取 不 同 的 信 ， 再 利用 式 
《7.3.12) ， 可 以 计算 破产 概率 的 数值 结果 〈 见 表 7 -2)。 


表 7 -2 不 同 初始 盈余 下 的 破产 概率 











于 
推论 7 -1 泊 松 盈余 过 程 1U(t) ，i 宇 01 的 破产 概率 满足 : 
ee 时 1 OL Mi(7) —1] 
ea pe) ST Op i ey) 
(7. 3. 14) 


式 (7.3.14) 右边 为 1 -yl(wu) 对 应 的 矩 母 函 数 。 
下 面 我 们 来 看 推论 7 -1 的 一 个 应 用 。 
若 互 为 指数 分 布 的 线性 组 合 ， 例 如 : f(x) =ciBie 和 +c,pB,e ,Bp, >pB, >0， 
cl >0,c, >0,cl +c =1 。 则 
1 


Pi=c% +Cc 


B B, 





Mi(7) =0 e+e Bb, Bi>r>0,rzpB, (7.3. 1S ) 


Bb Br ” 
式 〈7.3. 15) 的 左边 作为 矩 母 现 数 ， 按 照 期 望 存在 的 情况 其 定义 域 范 围 是 
r<y=pB, = min {B,，B,1。 然 而 ,， 式 (7.3.15) 的 右边 作为 一 般 的 函数 ， 其 
定义 域 可 以 扩展 到 7r>0 且 rzB, 和 7r 关 PB, 的 一 切实 数 。 为 简单 起 见 ， 我 们 仍 
然 用 符号 WMx(r) 表 示 这 个 扩展 了 定义 域 后 的 函数 。 
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将 上 述 计 算 结 果 代 人 式 (7. 3.14)， 有 : 


0 2g1(7) 
= ee 10 g(r7) 


其 中 : g,(7) 为 r 的 一 次 多 项 式 ，g,(7) 为 r 的 二 次 多 项 式 。 最 终 可 表示 为 : 








到 a 
-| edy(u) = 天 + 大 一 一 一 ， al >0,a,>0 
0 


Qi 一 了 ?a —r 
又 由 业 (%m ) =0， 则 有 
Vu) =ke ™ +he 

【 例 7-S】 试 由 式 (7.3.14) 推出 定理 7 -2 的 结论 。 

解 : 蕊 的 矩 母 函数 为 : 
a 1 
ac-r 1-pr’ 
代入 (7.3.13) 式 , 有 


要 | edy(u) = [| 


M,Cr) 一 








reE(0,7) 


1 0 
人 2 二 一 一 一， 则 
1 及 六 (1 +0)p,’ | 有 





r 


a ed[ll -wyw(u)] = ci 
上 式 的 右边 是 某 个 指数 分 布 清 数 的 和 矩 母 隐 数 ，y (wu) 的 唯一 解 是 yw(u) = 


= 
Cie 0 Li 


前 面 几 节 中 讨论 了 与 一 余 过 程 有 关 的 几 个 方面 ,并 从 不 同 的 角度 来 看 
待 “ 破 产 ” 这 个 特殊 事件 的 概率 。 在 第 一 节 中 我 们 曾 强 调 过 ， 本 章 的 目的 
就 是 要 获得 对 破产 概率 的 具体 表达 。 从 人 盈余 过 程 的 数学 模型 来 看 ， 破 产 概 
率 当 然 与 保险 人 的 初始 僵 余 “直接 相关 。 另 一 个 影响 破产 概率 的 主要 因素 
显然 是 保险 费 率 <， 而 c 又 直接 与 理赔 次 数 过 程 和 理赔 额 变量 有 关 ， 所 以 ， 

望 得 到 破产 概率 与 上 述 参 数 的 关系 。 

要 想 直 接 得 到 也 数 表达 关系 非常 困难 ，Lundberg (1919) 发 现 了 一 个 
闻 接 的 表达 方法 ， 即 引信 一 个 能 起 到 中 介 作 用 的 参数 ， 称 为 Lundberg 系数 
或 调节 系数 。 


7.4.1 调节 系数 的 概念 与 性 质 


Aeon Ri set ts 


定义 7-11 对 泊 松 盈余 过 程 ， 称 满足 以 下 方程 : 
A+cr=AM,(r), re (0,y) (7.4.1) 
的 非 零 正解 〈( 记 做 RR) 为 该 过 程 的 调节 系数 。 
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方程 (7.4.1) 是 关于 自 
变量 r 的 一 个 隐 式 方程 ， 方程 
左边 是 关于 7 的 一 个 线性 薄 数 ， 
方程 右边 是 理赔 额头 的 矩 母 也 
数 ， 是 一 个 下 凸 函 数 ， 两 者 的 
关系 见 图 7 -4。 

下 面 的 定理 给 出 了 调节 系 
数 RR 的 性 质 。 

定理 7-5 设 泊 松 盔 余 过 
程 中 理赔 额 变 量 头 的 答 母 函 数 
的 定义 域 为 (0，y) ， 其 中 y=< 图 7-4 调节 系数 方程 示意 图 
+%。 在 c>Ap, 的 假设 下 ,方程 (7.4.1) 有 唯一 的 正 根 尺 E(0，y)。 

证 明 : 令 g(r) =AMr(r) -A-cr,re (0,y), 若 g(r) 具有 以 下 性 质 : 

(1) g(0) =0 ; (2) 8 (0) <0 ; (3) limg (7) =+%; (4) g(r) >0， 
Vre(0, y)。 

则 方程 g(r) =AM,(r) -和 -cr 有 唯一 正 根 。 
事实 上 ， 

g(0) =AM.(0) -和 = 和-A=0 
g'(0)=M:(0) -c=Ap,—-c<0 
车 y < + ， 由 My(r) 的 定义 知 Mi(y) = +%m， 从 而 有 


limg(r)= + oo 
my 





R r 


若 Y=+%m， 由 Mi(r)=1 +Pir + + > 字 r， 有 
limg(r) = lim( AM (7) —A 入 -cr) > lim(A Ed 一 cr) = + co 
最 后 ， 有 
e&"(r) =AHM Cr) =AE(X’e”*) >0 
即 g(r) 为 下 凸 函 数 ， 结论 得 证 。 加 
车 将 c= (1+90)Ap, 代 入 (7.4.1)， 可 得 : 
1+(1+0)pr= MY(r) (7.4.2) 


这 个 调节 系数 方程 与 泊 松 盘 余 过 程 的 泊 松 参数 无 关 ， 在 使 用 上 有 其 方便 
之 处 。 

方程 (7.4.1) 和 (7.4.2) 往 往 很 难得 到 调节 系数 的 显 式 解 ， 这 也 正 是 
Lundberg 引信 调节 系数 这 个 中 介 参 数 的 原因 。 在 不 能 获得 R 的 精确 值 时 ， 
对 尺 的 可 能 取 值 范围 作出 估计 也 很 有 意义 。 

定理 7 -6 调节 系数 RR 满足 不 等 式 : 
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证 明 : 
A+cR =AM.(R) 


= Pip? LR’ 4.. 
=A[Ll+PR+FR +3R 十 
入 

=A+ApR + SR 


A 
=(c ~- Ap)R > TR 

















(7.4.3) 


-] >Afl +PR+ 宁 尼 ] 


2[ec - 2 
二 (7.4.4) 
Ap, Pa 
定理 7 -7 若 理赔 额 和 有 上 界 M， 则 有 
1 1 
R> lo np = Mls! +0) (453) 
证 明 : 为 证 式 (7.4.5)， 先 证 以 下 不 等 式 : 
Ce 人 vO<x<M (4 
事实 上 ， 从 *e 的 泰勒 展开 式 知 ， 对 于 任何 0<x 志 MM， 有 
RM 人 
Te +1 Dy ee 
RM 'x ( Rx)” Rs 
-1+E i 
根据 式 (7. 4. 1)， 
A+cR= AM(R) = Af e™f(x) dx < 和 | (He +1T -f(x) dx 
二 AP! an 十 A -8 
因此 有 
c 1 RM Ey ee (RM)’ RM 

Rt T= 31 +… <e 

从 而 结论 得 证 。 三 
10 000 25 000 

， 附 加 费 


【 例 7 -6】 设 泊 松 表 余 过 程 的 理赔 额 ~ i 


率 9=0.2。 试 写 出 调节 系数 的 方程 并 估计 R。 


解 : 由 已 知 
=0.9 x10 000 +0.1 x25 000 =11 500 


M(r) =0. 9elooo +0.1e25oor 
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又 知 9=0.2， 代入 式 (7.4.2) 得 : 
1 +13 800r =0.9e"™ +0.1e ™ 
从 该 方程 经 过 计算 机 和 迭代 可 解 出 调节 系数 R 的 近似 解 为 2.6 x10“。 另 外 ， 
由 于 : 
p; =0.9 x10 000’ +0.1 x25 000’ =1.525 x10” 
按 R 的 上 界 估 计 式 (7.4.3)， 有 


c 
| _2(13 800 -11 500) 
P， 加 152 500 000 


所 以 ,在 这 个 例子 中 R 的 上 界 估 计 式 (7.4.3) 还 是 比较 紧 的 。 放 
在 一 些 特殊 情况 下 ， 比 如 当 理 赔 额 变量 服从 指数 分 布 或 者 退化 为 常数 
时 ， 调 节 系 数 有 比较 简单 的 表达 。 
【 例 7-7】 设 复 合 泊 松 分 布 中 的 理赔 额 变量 服从 均值 为 1/e 的 指数 分 
布 ， 试 求 相 应 的 调节 系数 。 


解 : 由 于 M,(r) = 一 ， 调 节 系 数 方程 (7.4.2) 为 : 


=3.02 x10- 


+01 i Ce 
o Qa-—r 
经 过 简单 的 计算 ， 该 方程 的 正 根 即 调节 系数 为 : 


[el 
1+0 


【 例 7-8】 设 理赔 额 变 量 退 化 为 常数 1， 试 求 相 应 的 调节 系数 。 
解 : 由 于 Mi(r) = 五 (e ) =e ,调节 系数 方程 (7.4.2) 应 为 : 
1+(I+O)r=e 
即 求解 直线 y=1 + (1 +9)r 与 标准 指数 孙 数 曲线 y=e 的 交点 ， 对 于 不 同 的 
096 值 ， 可 用 数值 方法 求解 上 述 方程 获得 调节 系数 ， 表 7 -3 列举 几 个 计算 
结果 。 








R= C 


表 7 -3 不 同 0 和 值 下 的 调节 系数 R 











7.4.2 用 调节 系数 表达 破产 概率 

实际 上 ,破产 概率 可 以 用 调节 系数 R 的 函数 来 表示 ， 最 一 般 的 表达 式 
由 以 下 定理 给 出 

定理 7 -8 对 于 泊 松 盈余 过 程 ， 若 调节 系数 方程 (7. 4.2) 的 解 RR 存 


*。 132 。 


在 ， 则 破产 概率 ywy(u) 可 以 表示 为 : 
os 
[e 27<oo] 和 
证 明 : 对 于 任意 的 上 >0，r>0， 考 虑 : 
Ele™”®*]=Ele™"®? |T<it]PIT<it} +E[le "|T>i]PIT>+| 
(7.4.8) 





wl(u) = 之 宇 0 (7.4.7) 


因为 U(t) =w+ct 一 S(t)， 方程 的 左边 等 于 : 
exp | —ru—rct +AtL MC(r)—1]1} 
右边 第 一 项 中 的 U(it) 在 7T<i 的 条 件 下 可 变形 为 : 
TUi) =U(T) + UC) ~ U(T)=U(T) +ce(t -TT) - [S(t) -S(T)] ,Tat 
当 了 给 定时 ，[S(Ci) -5S(7T)] 与 UV(7T) 独立 ， 而 且 前 者 为 以 上 -了 为 指标 集 
的 复合 泊 松 过 程 ， 任 意 上 时 刻 的 泊 松 参数 为 (人 -了 T) ， 后 者 为 确定 的 值 。 则 
式 (7.4.8) 的 右边 第 一 项 可 写成 : 
E[exp( —rU(T))exp{ -reG-7T) +AC(E- TIM) -1]} | TsiJPITsi) 
若 民 为 方程 -rc+AL[LMi(r) -1] =0 的 解 ,， 将 RR 代入 方程 (7.4.8) 两 
边 ， 进 一 步 简 化 为 : 
e™”=Ele™?|T<]P(TS<t) +E[le ™”® |T>t]P(T>1t) (7.4.9) 
当 tw% 时 , 式 (7.4.9) 右边 第 一 项 将 收 仿 于 下 [Le |T<%] yw(u)。 
现在 只 要 证 明 式 (7.4.9) 右边 第 二 项 当 :一 % 时 趋 于 0， 定理 就 得 到 
了 证 明 。 
为 此 ,， 令 a=c-Api，B' =Ap,， 可 得 : 
E[U(t1)] =E[wu+ct—S(t)] =ut+t+at,Var[ U(#) |] =Var[ S(1)] =B2 


由 于 lim(w + at -Bs ) = +oco ， 因 此 对 充分 大 的 上 ， 可 以 将 式 (7.4.9) 右边 
第 二 项 再 展开 ， 有 
E[le™®? |T>t]P{T>i} 
Ele vr yO0UCG) utat -8 Pr» OU() < 
je + Ele™® |T>:,U(i) i he Be | 
- PET>#,U(#) Se 


而 当 了 给 定时 ， 在 了 >+ 的 部 分 ， 有 U(t) >0, 所 以 天 [e 0 |T>it]<1, 从 
而 有 


之 
3 


2 
Ele™™®? |T>t,0<U(t) <u tat -Bt PIT>t,O0<U(t) <u+at -Bl} 


2 工 
<P{U(t) <u tat -p< ’ 


上 面 的 最 后 一 个 不 等 式 由 概率 论 中 的 切 比 雪夫 不 等 式 得 到 。 同 时 有 : 


2 2 
E[e™™® |T>s,U(t) >utat -BPIT>t,U(t) >u+at— Bi} 


<exp[ By 
所 以 ， 当 1 一 时, 式 (7.4.9) 右边 趋 于 0， 定 理 得 证 。 天 
定理 7 -8 是 关于 破产 概率 的 一 个 精确 表达 式 ， 通 过 它 还 可 以 获得 破产 
概率 的 近似 表达 。 容 易 看 出 ， 当 7T<w%w 时 ， 有 U(T) <0， 所 以 瑟 [e cn 1 
T<%o]>1， 因 此 有 
yu) Ee " ,us0 (7.4.10) 
式 (7.4.10) 给 出 了 破产 概率 的 上 界 ， 具 有 一 定 的 可 操作 性 ， 被 广泛 
使 用 ， 先 看 一 个 典型 的 例子 。 
【 例 7-9】 由 定理 7 -8 推导 定理 7 -2 关于 指数 分 布 破 产 概率 的 


结论 。 
解 : 考虑 均值 为 二 的 指数 理赔 额 分 布 ， 由 例 7 -7 可 得 R= 了 ja。 


下 面 考虑 - U(T) 的 分 布 。 假 如 破产 发 生 在 时 刻 了 ， 令 到 表示 破产 时 
刻 前 一 个 瞬间 的 盈余 (VCT- ))， 因 为 下 一 个 瞬间 时 刻 破 产 发 生 ， 所 
以 破产 时 刻 了 发 生 的 理赔 额 必 然 大 于 二 ;对 于 任意 的 y>0, 若 -V(7) 
>y 发 生 ， 则 破产 时 刻 的 理赔 额 必 大 于 z+y， 因 此 事件 ~-U(T) >y 的 
条 件 概率 为 : | 
PC(-U(T) >yl U(T-) =i,T< oo) 
= P(X >i+t+y1lX > i) 


所 以 , 条 件 随机 变量 [ - U(T) |7 < um] 仍然 服从 均值 为 二 的 指数 分 
布 ， 即 ; 














FF e -ACT ee 
[e | 山王 二 二 二 二 下 二 
因此 有 
二 1 -iv 1 = 人 和 
wt 人 1+0° : 四 


显然 ， 这 个 结论 与 定理 7 -2 的 结果 一 致 。 
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pr A 六 人 EECepOETSPROeSSSGS CTET 


我 们 在 前 面 四 节 学 习 了 连续 时 间 破 产 模 型 并 对 终极 破产 概率 的 计算 从 
三 个 角度 进行 了 研究 。 连 续 时 间 模 型 中 ， 我 们 需要 持续 不 断 地 检查 公司 的 
盈余 ， 但 在 现实 中 往往 很 难 实现 真正 的 连续 观测 ， 因 为 时 间 都 是 离散 的 ， 
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例如 : 年 、 季 、 月 等 ， 更 可 能 采取 的 方法 是 定期 检查 一 余 。 为 此 ,我 们 需 
要 考虑 离散 时 间 的 天 余 过 程 。 
定义 7-12 称 下面 的 过 程 {U(n) ,n=0,1,…| 为 盈余 序列 : 
U(n) =u+cn—-S(n),S(0) =0 (7.5.1) 
其 中 : 
(1) w 为 初始 一 余 ，u 宇 0 ; 
(2) c 为 单位 时 间 (一 般 为 一 年 ) 内 的 平均 保费 收入 ,一般 要 求 cn = 
(1+0)E[S(n)] >E[S(n)]， 即 : 96>0， 称 9 为 安全 系数 ; 
(3) SCn) = 玉 + W,+…+W, 表示 前 面 n 期 的 理赔 总 量 ，W,( i=1,，2， 
，n ) 为 第 i 年 的 总 理赔 量 ， 一 般 情况 下 WW ， 瑟 ，…， 肌 , 是 独立 同 分 布 
的 随机 变量 ， 共 同 分 布 记 为 Fy(x)。 
同样 地 ， 对 于 离散 时 间 盈 余 过 程 (7. 5.1) 也 会 考虑 与 破产 有 关 的 各 种 
变量 。 
定义 7 -13 对 盈余 序列 〈7. 5.1) 定义 如 下 与 破产 有 关 的 变量 : 








称 了 =minfn:U(n) <0} 为 破产 时 刻 ; 


称 $ (wu,n) =P(U(E) 宇 0, Vt=0,1,…,n) ,n=1,2,…， 为 离散 时 间 有 
限 生 存 概 率 ，; 

称 Cun) =1-$ (un) =P(It=1,2,.,n,U(t) <0) ,n=1,2, .……, 
为 离散 时 间 有 限 破 产 概率 ; 


称 由 (z) =P(U(t) 宇 0,Vt=0,1,…) ,n=1,2，…， 为 离散 时 间 终 极 生 
存 概 率 ; 
称 风 (wu) =1-$(wu)=P(It=0,1,-…,U(i) <0),n=1,2，-.， 为 离 


散 时 间 终 极 破 产 概率 ; 
性 质 7-2 对 于 wu 和 0<n,<<n,<%m， 有 以 下 结论 成 立 : 


(1) yw ney (un) ,n=1,2,.; 
(2) Ym) Sy); 
(3) Yun)<y um) < yu); 


(4) limy (u,n) = y (u)。 
离散 时 间 盈 余 序 列 破 产 概率 的 计算 不 易 像 连 续 时 间 模 型 的 定理 7 -1 那 
样 考虑 微 积分 方程 。 但 是 ， 可 以 得 到 一 些 关 于 时 间 的 递 推 关系 。 


性 质 7-3 盈余 序列 (7.5.1) 的 离散 时 间 有 限 生 存 概率 由 (zx，m) 
满足 以 下 递 推 关系 : 
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(1) $b un)= $b(u,n-1) xP(U(n)=0|U(n-1)>=0), 
n=1,2,.. ,$ (u,0) =1 


(2) yy un) =POUCn) <017( 1)20) +y (un-1)xP(U(n)>= 
0|U(n-1)>=0) 
只 要 利用 定义 7 -8 中 的 表达 式 


$b (u,n) =P{IU(1)>=0, U(2) =0,.…,U(n) =0|, n=1,2,-. 
和 和 竹 余 过 程 的 马 氏 性 很 容易 证 明 性 质 7 -3。 基 于 这 个 性 质 ， 可 以 得 到 生存 
概率 关于 时 间 的 积分 递 推 公式 。 


定理 7~9 将 共 余 序列 (7.5.1) 的 生存 概率 $ (u，n) 看 做 (u,，n) 
的 二 元 函数 ， 则 有 限 生存 概率 满足 以 下 递 推 公式 : 


$ (u,n) = 向 由 (zx +Cc—- Xx,n-1l)dFy(x),n = 1,2,.…,u 宇 0 
(7. 5. 2) 


特别 地 ， 有 : 由 (zz，1) =F,(w+c)。 
【 例 7-10】 现 有 如 下 攻 余 序列 : 初始 长 余 为 2， 年 保费 收入 为 3， 年 
损失 量 分 布 如 下 : P(WW=0) =0.6=1-P(W=6)。 试 计算 前 两 年 内 破产 的 


概率 yy (2，2)。 
解 : 
5, p=0.6 


U(0) =2,U(1) -| 
= g =0.4 


所 以 : 由 (2，1) =0.6 

又 有 P(U(1) =5,U(2) =8) =0.6 x0.6 
P(U(1) =5,U(2) =2) =0.6 x0.4 
P(U(1) = -1,U0(2) =2) =0.4 x0.6 
P(U(1)= ~1,U(2) = -4) =0.4 x0.4 


所 以 ， 由 (2,2) =P(U(1) >0,U(2) >0) =0.6 x0.6+0.6 x0.4=0.6。 因 
此 ，yw (2,2) =0.4。 但是， 注意 : 


P(U(2) >0) =0.6 x0.6 1+0.6 x0.4 +0.4 x0.6 =0.84 $ (2,2) 


类 似 地 ， 可 以 定义 盈余 序列 模型 的 调节 系数 中 为 方程 
e“M,(r)=1 (7.5.3) 
的 正 根 。 注 意 , 式 (7.5.3) 可 以 变形 为 : 
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log My(r) -cr=0 (7. 3.4) 
当 人 WW 为 复合 泊 松 分 布 时 ， 有 log My (r) =ALMrGr) -11， 所 以 ， 式 
(7.5.4) 与 AMi(r) = 入 +cR 等 价 ， 即 当 第 i 个 时 期 的 总 理赔 量 为 复合 泊 松 
分 布 时 ， 离 散 时 间 模 型 的 调节 系数 与 连续 时 间 的 调节 系数 相同 。 
基于 调节 系数 方程 (7. 5.3)， 也 可 以 得 到 一 个 与 定理 7 -8 相 类 似 的 
结论 。 
定理 7-I0 对 于 定义 7 -7 给 出 的 恤 余 序列 ， 当 =0 时 ， 破 产 概 率 


几 (z) 有 以 下 的 表达 式 : 


a GE ,w=0 (7. 5.5) 


E[e-® | F<w] 
其 证 明 过 程 可 参阅 (Bower etc，1997)。 ; mm 
由 定理 7 -10 自然 有 





yu)<e™", wu>0 


成 立 。 


【 例 7-11】 车 W, 服 从 正 态 分 布 N(u，o )， 求 调节 系数 尺 的 表达 式 。 
解 : 由 已 知 : 


log M,(r) =Ar + ior 





2 
将 其 代 人 方程 (7. 5. 4) ， 有 
名 = 
Oo 


男 外 ， 对 于 一 般 的 F,(x) ， 有 log M,(7) 的 展开 式 : 


log My (r) = +r 十 …， 








其 中 , 不 = 开 [ 多 1]，oz = Var[ W]。 因 此 韵 =24e=4) 也 可 看 做 是 对 站 的 一 


Oo 


种 近似 。 加 


特别 地 ， 当 W, 为 随机 变量 N 与 X 的 复合 分 布 ,， 且 c=(1+0)j， 尺 可 
近似 地 表示 为 : 
20p,E(N) 
(p, —p)E(N) +piVar( N) 
其 证 明 过 程 比较 简单 ， 读 者 可 自行 证 明 。 


RR 





(7.5.6) 


【 例 7 -12】 在 以 下 情形 计算 R 的 近似 值 : 
(1) N 服从 参数 为 A 的 泊 松 分 布 ，A >0 ; 


(2) N 服从 参数 为 r 和 p 的 人 负 二 项 分 布 , r>1, 0 <p<l1。 
解 : 

(1) 将 ECN) =Var(N) = 入 代入 (7.5.5)， 有 

20p， 

- 


(2) 将 ECN) = 部 和 Yor(N) = 党 代入 式 (7.5.5), 有 


R= 


中 加 二 
也 :> | 
当 p 一 1 时 ， 将 得 到 与 (1) 相同 的 结果 。 国 


$7.6 最 优 再 保险 与 调节 系数 


我 们 在 第 六 章 已 经 了 解 ， 按 照 原 保险 人 与 再 保险 人 分 担 损失 的 方式 ， 
可 以 把 再 保险 分 为 限额 损失 再 保险 和 比例 再 保险 。 对 于 比例 再 保险 ， 由 于 
其 损失 分 割 和 保费 摊 回 都 按照 固定 比例 确定 ， 因 此 再 保险 的 风险 与 收益 比 
较 明 晰 ， 相 对 容易 决策 ; 而 限额 损失 再 保险 却 由 于 自 留 额 与 承保 的 损失 密 
切 相 关 ， 因 此 必须 在 综合 评估 风险 的 基础 上 才能 确定 自 留 额 。 

这 一 节 将 通过 两 个 例子 说 明 ， 首 先 ， 在 其 他 条 件 相同 的 情况 下 ， 限 额 
损失 再 保险 的 风险 小 于 比例 再 保险 ; 其 次 ， 如 何 确 定 限 额 损 失 再 保险 的 自 
留 额 。 与 第 六 章 从 平均 损失 的 角度 讨论 风险 不 同 ， 这 一 节 我 们 将 从 调节 系 
数 的 角度 来 评估 风险 。 


人 


我 们 对 限额 损失 再 保险 模型 和 比例 损失 再 保险 模型 从 破产 的 角度 作 一 
个 比较 分 析 ， 这 里 假定 所 有 的 再 保险 规则 都 是 针对 原 保 险 人 的 理赔 额 变量 
XX 设 定 的 ， 则 再 保险 人 承担 的 损失 如 下 : 

0 ， 有 =<d 
限额 损失 再 保险 : 7,(X) = 和 (7.6.1) 
比例 再 保险 : I(X) =h，0 <k<1, 天 为 原 保险 人 的 分 出 比例 
(7. 6.2) 

【 例 7 -13】 已 知 理赔 总 量 为 复合 泊 松 过 程 S(t) ， 参 数 和 =1， 理 赔 额 
站 在 [0，1] 上 均匀 分 布 , 保险 人 的 费 率 为 c=1。 现 在 考虑 再 保险 附加 费 
率 为 100% 和 140% 两 种 情 沈 : 

(1) 比例 再 保险 模型 : I(X) = KX， 分 别 对 =0, 0.1, 0.2,，…,1 计 
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i > 
算 调 节 系 数 ; 

(2) 限额 再 保险 模型 : 7(X) = 7,( 宗 ) ， 分 别 对 d=0, 0.1, 0.2, -…,1 
计算 调节 系数 ; 


(3) 在 期 望 收益 相等 的 条 件 下 ， 比 较 两 类 模型 的 调节 系数 与 再 保险 安 
排 的 关系 。 
解 : 


因为 p, = 了 


= 元 ，A =1， 而 且 e=1， 所 以 原 保险 人 的 附加 费 率 为 6= 1。 


QD 对 于 不 同 的 上 E， 设 相应 的 再 保险 费 率 为 cc，8 为 再 保险 附加 费 率 ， 则 
有 


c=(1+0)AE[I(X)] = (1 +0)AkELX] -+ 


原 保 险 人 的 自 留 保 费 为 : 1 
望 为 : 


一 引 汪 0， 实施 再 保 后 原 保险 人 自 留 风 险 的 其 


A(1—k)E[X] = 
再 保 后 的 调节 系数 方程 为 : 4+(c-cs)r=AnMi((1I1-p)r)， 代 和 人 后 有 : 
2-k-0k _e 一 1 
2 “7r(1L 二 全 
当 8=1 时 ， 再 保 后 的 调节 系数 方程 为 : 
e 必 -1 


r(1I 一 天 ) 


1 





1+(1 -Ek)r= (7.6.3) 
车 记 7=(1 -kk)r,， 且 民 为 

e =1+F+ 产 (7.6.4) 
的 非 零 解 ， 式 (7.6.4) 相当 于 上 =0 时 (不 安排 再 保 ) 的 调节 系数 方程 。 


则 对 于 一 般 的 上 =0,， 0.1， 0.2,…,1， 式 (7.6.3) 的 解 为 : R= 


经 过 数值 计算 ，(7. 6.4) 的 解 为 1.793， 所 以 ,09=1 时, 式 (7.6.3) 
中 再 保 后 的 调节 系数 为 R=1.793/(1 ~k)， 可 以 看 出 ，R 是 比例 再 保险 中 
再 保 比 例 系 数 开 的 增 函 数 ， 也 就 是 说 ， 随 着 再 保 比 例 的 增加 ， 原 保险 人 的 
调节 系数 也 会 增加 ， 破 产 概率 的 上 界 会 降低 ， 这 与 现实 的 直觉 相符 。 这 个 
例题 中 ， 出 现 这 种 再 保 比 例 系 数 与 调节 系数 直接 的 单调 增 关系 ,可 能 是 由 
于 原 保险 的 附加 费 率 与 再 保 的 附加 费 率 相同 ， 均 为 1。 

对 应 不 同 的 上 =0,， 0.1,， 0.2,…,1 值 , 式 (7.6.3) 的 解 列 在 表 
7-4 中 。 
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表 7-4 例 7 -13 的 调节 系数 (1) 


调节 系数 R | 调节 系数 R 








98=1 | 98=1.4 8=1 8=1.4 














当 9=1.4 时 ， 原 保险 人 的 自 留 保 费 为 : 1 


-全 0112 


实施 再 保 后 原 保险 人 自 留 风 险 的 期 望 为 : A(1 -k)ELX] = (1 ~k)/2， 扫 保 
后 的 调节 系数 方程 为 : 


e0 9 一 1 
r(1l 一 天 ) 

式 (7.6.5) 没有 与 式 (7.6.3) 相似 的 一 般 性 结果 ， 只 能 分 别 对 = 
0，0.1，0.2，…，1 计算 数值 解 ， 结 果 列 人 表 7 -3。 从 计算 结果 可 以 发 
现 ， 调节 系 数 R 先是 随 着 再 保险 比例 k 的 增加 而 缓慢 上 升 ， 也 就 是 说 破产 
概率 降低 ; 但 是 ， 当 有 上升 到 一 定 水 平 (4>0.5 ) 后 ,调节 系数 尺 急 剧 下 
降 ， 也 就 是 说 破产 概率 增加 ， 原 因 是 随 着 的 增加 原 保险 人 的 自 留 保 费 1 - 
1.2k 可 能 不 足以 支付 原 保 险 人 自 留 风 险 的 期 望 (1 -k) /2， 即 原 保险 人 
(从 最 终 的 意义 看 ) 必然 破产 ， 调 节 系 数 为 零 或 者 是 负 值 。 

特别 地 ， 当 原 保 险 人 的 自 留 保 费 1 -1.24 与 原 保 险 人 自 留 风险 的 期 望 
(1 -上 )/2 相等 时 ， 有 : k=5/7。 调 节 系 数 方程 (7. 6.5) 为 : 


1+(1-1.25)r= (7. 6. 5) 





er -1+r(l 一 大 ) + 于 [r(1 一 大) ] 


由 函数 e 的 性 质 知 ， 上 式 在 非 负 的 定义 域内 没有 非 零 解 。 所 以 ， 当 大 = 
0.8，0.9，1 时 ， 不 存在 非 负 的 调节 系数 。 
@@ 在 限额 损失 再 保险 模型 下 ， 设 相应 的 再 保险 费 率 为 cu， 则 


os = (+b)MECD) = (L+oOAf (4-d)dr = 人 +00 -中 


_ (+0)(1-d) 
2 


过 
3 [= 


原 保 险 人 的 自 留 保 费 为 : 1 ， 实 施 再 保 后 原 保 险 人 自 留 风 


险 的 期 望 为 : 和 A(E[X] -EL[1])= 


"139 - 


.140 - 


分 别 对 两 种 再 保 附 加 费 率 的 情况 确定 调节 系数 方程 : 
e“ 一 1 


r 


=1 时 ,1+[1-(1-cd)]r= +(1-d)e”" 





rd 
e 一 1 


这 两 个 表达 式 没 有 一 般 的 解 ， 只 能 数值 求解 。 结 果 列 在 表 7 -3 中 。 

与 比例 再 保 的 情形 类 似 ， 当 0=1 时 ， 随 着 自 留 额 d 的 降低 ， 原 保险 人 
的 调节 系数 增加 ， 破 产 概 率 的 上 界 降 低 。 当 9=1.4 时 ， 从 计算 结果 ， 我 们 
发 现 ， 调 节 系 数 RR 先是 随 着 自 留 额 d 的 降低 而 缓慢 上 升 ， 也 就 是 说 破产 概 
率 降低 ; 但 是 ， 当 d 降 到 一 定 水 平 (k <0.3 ) 后 ， 调 节 系 数 尺 急剧 下 降 ， 
也 就 是 说 破产 概率 增加 ,原因 是 随 着 4d 的 降低 原 保 险 人 的 自 留 保 费 
(1+0) (1 -4d)’ 


0=1.4 时 , 1+[1-1.2(1-d)’]r= + (1-d)e” 








1 1 一 1.2 (1 -4Q)’ 可 能 不 足以 支付 原 保 险 人 的 自 留 风 险 
的 期 望 (一 -， 也 就 是 说 原 保险 人 (从 最 终 的 意义 看 必然 破产 ， 调 
节 系 数 为 零 或 者 是 负 值 。 


特别 地 ， 当 原 保 险 人 的 自 留 保 费 与 原 保 险 人 自 留 风 险 的 期 望 相 等 时 ， 
有 : 4d=1- V5/7 =0.1548， 调 节 系 数 方程 在 非 负 的 定义 域内 没有 非 零 解 。 
所 以 ， 当 d=0.1 和 d=0 时 ,不 存在 非 负 的 调节 系数 。 

@@ 当 附 加 费 率 相同 时 ， 要 保持 不 同 再 保 方 式 下 有 相同 的 期 望 收 益 ， 只 
要 令 : 





E(kEX) = E[1,(X)] 
即 与 4 满足 k=(1 -4d)*， 然 后 固定 d=0，,0.1，,0.2，…，1， 由 上 式 解 得 
对 应 的 下 值 ， 并 进一步 求解 调节 系数 ， 最 终结 果 列 人 表 7 了 7 -5。 














表 7 -5 例 7 -13 的 调节 系数 (2) 
调节 系数 妨 
天 d 0=1 9=1.4 
比例 损失 模型 限额 损失 模型 比例 损失 模型 限额 损失 模型 

0. 00 1.0 1. 793 1.793 1.793 1.793 
0.01 0.9 1.811 1. 833 1. 807 1. 828 
0. 04 0.8 1. 868 1.940 1.848 1.920 
0.09 0.7 1.971 2.116 1.921 2.062 
0.16 0.6 2.135 2.378 2. 030 2. 239 
0.25 0.5 2.391 2.768 2. 181 2.518 
0. 36 0.4 2. 802 3.373 和 372 2. 840 
0. 49 0.3 3.516 4. 400 2. 535 3. 138 
0. 64 0.2 4. 981 6.478 1.992 2. 525 
0.81 0.1 9.438 12. 746 … 
1.00 0.0 o o 
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计算 结果 表明 ， 在 两 类 再 保险 模型 期 望 收益 相 等 的 条 件 下 时 ， 无论 再 
保险 的 附加 费 率 如 何 选取 ， 限 额 损失 再 保险 的 调节 系数 始终 大 于 比例 再 保 
险 的 调节 系数 ， 在 一 定 的 意义 下 ， 也 就 是 说 ， 限 额 损失 再 保险 破产 的 可 能 
性 相对 较 低 ， 风 险 较 小 。 实 际 上 ， 这 一 结果 更 一 般 的 结论 与 效用 函数 有 关 ， 
此 处 不 再 著述 。 是 


7.6.2 自 留 额 与 调节 系数 


通过 第 六 章 的 例 6 -11 我 们 知道 ， 随 着 原 保 险 人 自 留 额 的 提高 ， 再 保 
险 人 的 承保 风险 逐渐 降低 。 下 面 我 们 从 调节 系数 的 角度 再 次 考虑 确定 自 留 
额 的 问题 。 

【 例 7-14】 已 知 茶 保单 组 合 每 年 发 生 的 诊 合 理赔 量 是 相互 独立 且 具 
有 相同 分 布 的 随机 变量 ， 均 为 复合 泊 松 分 布 ， 参 数 为 A =1.5， 理 赔 额 变量 
了 服从 分 布 p(1) =2/3 =1 -p(2)， 又 假设 各 年 的 保费 均 按照 费 率 c=2.5 收 
取 。 保 险 人 现在 考虑 选择 限额 损失 再 保险 方式 对 每 年 的 总 理赔 进行 再 保险 ， 
如 果 再 保险 人 按 100% 的 附加 费 率 收 取 再 保费 ， 试 计算 下 列 情 况 下 原 保险 人 
自 留 风 险 的 调节 系数 及 期 望 收益 : 

(1) 不 进行 再 保 ; 

(2) 免 赔 额 为 0，1，2，…，10。 

解 : 这 时 ， 各 年 的 总 理赔 模型 与 例 6 -11 相同。 对 于 d=3，4，5，…， 
记 瑟 , 为 原 保 险 人 各 年 自 留 风 险 的 总 理赔 额 变 量 ， 琵 , 的 分 布 为 : 

PCOW,=x) = 广 (x) ,x=0,1,.…,d-1 ;P(W,=d) =1-F,(d-1) 

其 中 f(x) 和 F(x) 均 来 自 表 6 -7。 

原 保 险 人 各 年 的 自 留 保 费 记 为 cv， 则 cs, =c-25(7) =2.5 -2E(1,)。 
调节 系数 方程 为 : 


e” = My(r) = 5 f(x) er t+t[1—-F(d~1)]e” 
保险 人 自 留 风险 的 期 望 收益 为 : 
co- E(W,) =2.5 -2E(1,) -LE(W) ~-E(L)]=0.5-E(L,) 
所 以 ， 由 表 6 -7 可 知 ， 当 d<2 时 ,不 会 实施 限额 损失 再 保险 。 
对 于 不 进行 再 保险 的 情况 ， 由 式 (7. 4.1) 得 : 


1I.5S+t2.Sr=e- + 


经 过 数值 计算 ， 解 得 RR=0.28， 此 时 保险 人 的 期 望 收益 为 0.5。 
根据 表 6 -7 的 数据 和 上 述 的 计算 过 程 ， 我 们 将 各 种 免 赔 额 的 计算 结果 
列 人 表 7 -6【〈 请 读者 自行 验证 ， 特 别 注意 调节 系数 的 计算 )。 


.141 . 


. 142 . 


a -了 
表 7-6 例 7-14 的 计算 结果 
免 赔 额 d 自 留 保费 cs 调节 系数 期 望 收益 
3 1. 822 0. 249 0. 161 
4 2. 186 0.347 0.343 
1 2.364 0. 336 0. 432 
6 2. 445 0. 315 0. 473 
1 2. 479 0. 301 0. 489 
8 2. 492 0. 292 0. 496 
9 2.497 0. 287 0. 499 
10 2. 499 0. 284 0. 500 











从 以 上 的 计算 结果 可 以 看 出 ， 随 着 自 留 额 的 增加 期 望 收益 逐渐 增加 ， 
所 以 不 分 保 的 期 望 收益 最 大 。 如 果 我 们 简单 地 将 调节 系数 等 同 于 破产 概率 ， 
则 调节 系数 越 大 破产 概率 的 上 界 越 小 ， 也 可 以 看 做 是 破产 概率 越 小 〈 并 不 
总 是 成 立 ) 。 从 上 面 的 计算 中 可 以 发 现 ， 调 节 系 数 并 不 是 随 着 自 留 额 的 增加 
而 愈 来 你 大， 也 就 是 说 ， 并 不 是 像 直观 感觉 的 那样 : 自 留 的 风险 越 多 破产 
概率 越 大 。 当 免 赔 额 为 4 时， 调节 系数 最 大 ， 也 可 以 看 做 是 破产 概率 最 小 ， 
或 者 说 破产 风险 最 小 、 最 安全 ; 而 免 赔 额 为 3 时 调节 系数 很 小 、 期 望 收 益 
也 很 小 ， 是 最 不 可 取 的 再 保 方 式 ， 免 赔 额 为 5 时 ， 调 节 系 数 不 如 免 赔 额 为 4 
的 大 ， 但 是 期 望 收益 有 所 提高 。 因 此 ， 从 破产 风险 与 收益 的 平衡 看 ， 免 赔 
额 为 4 或 5 都 是 可 选 的 再 保 方 式 。 到 


$7.7 布朗 运动 与 盈余 过 程 


在 这 一 节 之 前 ， 我们 对 破产 概率 所 得 到 的 最 好 的 结果 就 是 式 (7. 4.7) ， 
但 是 这 个 结果 比较 复杂 而 且 不 利于 计算 。 在 一 定 的 条 件 下 ， 我 们 可 以 把 净 
现金 流入 过 程 近 似 为 一 个 带 漂 移 项 的 布朗 运动 ， 从 而 得 到 破产 概率 更 为 简 
洁 的 表达 。 


7.7.1 布朗 运动 与 净 现 金 流入 过 程 


定义 7 -14 称 | 了 (1) ， 10} 为 带 漂移 的 布朗 运 云 动 ， 如 果 

(1) W(0) =0 

(2) { 焉 (1) ,it 宇 0| 具有 平稳 独立 增 量 性 ; 

(3) 对 任意 的 :>0， 有 W(t) ~WCutot) ， 其 中 从 0。 

特别 地 ， 当 人 =0 时 称 | 丈 (i) ，t 宇 0} 为 布朗 运动 ， 布 朗 运 动 的 每 条 轨 
道 处 处 连续 ， 处 处 不 可 导 。 

我 们 重新 考虑 7.2 节 讨 论 的 盈余 过 程 : 


(全 


LIi) =wu+ct— S(t) =u+tct—- YX,t>0 
i=l 


第 七 章 ” 破产 模型 


其 中 zx 为 官 始 熏 余 , =0 ; c 为 单位 时 间 内 收取 的 保费 ; { N(i1)， :> 
0} 是 强度 为 4 的 泊 松 过 程 ， 理 赔 额 变量 X,,，i=1, 2,，… 独 立 同 分布 ， 都 
与 N, 独立 ,天 都 权 正 值 ， 且 和 矩 母 画 数 存在 。 

盈余 过 程 是 一 个 跳跃 变化 的 过 程 ， 它 从 U(0) =w 出 发 ,以 速率 c 连续 
递增 ， 并 且 在 索赔 发 生 时 间 {7,，7T,，…1 发 生 向 下 的 跳跃 X,，X,，…， 盟 


N(z) 


余 过 程 的 一 个 轨道 见 图 7 -5, 其 中 U(t) = 30 +35: - 2》 X;, 10, A=4,， 
下 服从 均值 为 8 的 指数 分 布 。 

100 

80 


60 





图 7-5 泊 松 盈余 过 程 的 样本 轨道 
如 果 令 Z(t) =cd-SCG) ，t>0， 则 
U(t1) =u +Z(it), t=0 | 
Z(t) 是 时 间 段 [0, it] 内 保险 公司 的 净 现 金 流入 。 对 于 承保 范围 很 广 的 险 


种 ， 投 保 与 索赔 通常 很 频繁 ， 而 且 相 对 都 是 小 额 案 赔 ， 也 就 是 说 ，c< 与 入. 


相当 大 ， 而 站 却 比较 小 ， 此 时 ， 过 程 1Z(1t) ,=0} 的 轨道 频繁 地 进行 小 
幅 的 跳跃 ， 如 图 7 -6 所 示 ,， 其 中 c=35, 和 A =1 000, 蕊 服从 均值 为 0.03 的 
指数 分 布 ， 这 与 带 漂移 项 的 布朗 运动 具有 极 小 均值 和 极 小 方差 的 特征 非常 
相似 ， 这 启发 我 们 利用 带 漂移 项 的 布朗 运动 来 近似 净 现 金 流 入 过 程 。 

定理 7-1L 当 A 一 wm 时 ,满足 上 述 条 件 的 净 现 金 流 入 过 程 {2(:),: 
宇 01 可 以 表示 为 带 漂移 项 的 布朗 运动 。 

证 明 : 首先 有 Z(0) =0, 而且 由 3S(Ci) 的 平稳 、 独 立 增 量 的 特征 易 知 
Z(t) 也 满足 增 量 的 平稳 性 和 独立 性 。 

下 面 考虑 其 近似 分 布 ， 由 于 随机 变量 的 矩 母 函数 具有 与 分 布 一 一 对 应 
的 特征 ， 我 们 从 考察 Z(t) 的 矩 母 泣 数 Mz,,(r) 入 手 。 
因为 Mw (7) = Ms (7) = 已 [Le ] 

=e"E[e 307] =e™ Ms,,( ~—r) = eextr( -7r)—1] 


ln Ms (7) 
t 


所 以 ， =cr+A[M,( —-r)—-1] (7.7.1) 


.143- 


精算 模型 


.144 ， 


0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 
t 


图 7-6 净 现 金 流 入 过 程 的 样本 轨道 


由 已 知 E[2(2)] =[c~-AE(X)]i,Vaor[2(i)] =AE(X)t 
令 c-AEX =jp，AE(X)=o 那么 ， 有 c= + AEX,， 将 其 代入 式 
(7.7.1)， 有 


ln M,,, (r) 
1 


再 把 M*(-r) 在 0 点 进行 泰勒 展开 并 代入 式 (7.7.2)， 有 


= [jy +AE(X) Jr+A[M,( -7r)-1] (7.7.2) 


[i + AE(CX)Jr+A[l rE(X) + ECX’) 
-FE(X) +… -1] 
=pr+ AE(X) - ALE(X) -aHE(X) +…] 
A (7.7.3) 


再 令 理 赔 额 随 机 变量 并 = wy， 其 中 了 具有 固定 的 均值 和 方差 ， 那 么 ， 
E(X’) =a'E(Y), k=0,1,2,.. 
所 以 式 (7.7.3) 变 为 : 


ln M (r) 
t 





个 A 六 -过 
Eo py er ed 
=Ar + Fr Xo | FEY) mrt | 


arE(Y) _arE(Y) 本 
31 E(Y) 4! E(Y) | 





2 
=pr + -ol (7.7.4) 


2 


2 2 








Ee 三 世人 。 1 —> S 一 > co 

再 由 A ECR) ECF) 二 可 知 a 0 时 ，A 
oarE(Y’) _ orE(Y) et 
因此 ， lim 31 E(Y) 4! E(Y) ] =。 
eB) ae .| -0 


等 价 于 “Jim| 3 5CPJ 4 BCY) 
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-< 一 
所 以 有 lm he = pe (7.7.5) 
由 limMao (7) = ep + 7 (7.7.6) 
式 (7.7.6) 的 右 端 就 是 均值 为 i、 方差 为 oi 的 正 态 分 布 的 矩 母 函 数 ， 这 
就 证 明了 净 现 金 流 和 过程 的 极限 过 程 是 带 漂移 项 的 布朗 运动 。 天 


7.7.2 ”盈余 过 程 的 破产 概率 
既然 净 现 金 流 入 过 程 在 一 定 条 件 下 可 以 用 带 漂 移 项 的 布朗 运动 近似 ， 
那么 我 们 就 可 以 假定 初始 资本 为 u 的 盈余 过 程 为 : 
U(t) =u + W(ti) ,t=0 (7.7.7) 
其 中 {WW(z) ,i 宇 01 为 带 漂 移 的 布朗 运动 ， 其 均值 和 方差 分 别 为 jt 和 oi。 
下 面 我 们 再 考虑 有 限时 间 区 间 (0，r) 内 的 破产 概率 y(u，7): 
yl(u,T) =P(T <7) =P(minU(z) <0) =P(minW( i) <—u) 
定理 7 -12 对 于 上 述 描述 的 盘 余 过 程 ， 有 以 下 结论 成 立 : 
(1) 有 限时 间 破 产 概率 为 : 


vr) | (7.7.8) 
其 中 中 (: ) 是 标准 正 态 分 布 的 累积 分 布 函数 ; 
(2) 终极 破产 概率 为 : 
a (7.7.9) 


(3) 破产 时 刻 了 的 条 件 分 布 函数 为 : 


Eu uw 十 HT L 一 HT 
Forre (CT) =e” | 所 +2[ - 7 





,T>0 (7.7. 10) 


2 
CT oT 





证 明 : 

(1) 对 于 盘 余 过 程 {1U(t) ，i 宇 01 在 时 间 区 间 (0, 7) 内 的 任意 一 条 
样本 轨道 ， 它 在 1 =7 的 值 无 非 是 U(7) <0 和 U(7) 宇 0 两 种 情况 。 如 果 
(Cr) <0， 那 么 相应 的 样本 轨道 必 在 某 一 时 刻 T<7 处 穿 过 时 间 轴 ， 从 而 存 
在 使 U(:) <0 的 点 ， 即 破产 发 生 。 我 们 令 这 类 样本 轨道 的 集合 为 : 


4 = {Ts<7r, -nd<U(T)<-(n~-1)6}, 6>0,n=1,2,.… 
(7.7.11) 
由 于 U(7) <0 时 必 有 破产 发 生 ， 因 此 ， 
A-={-ns<U(r)<-(n-1)6} 
对 于 U(7) 宕 0 的 样本 轨道 ， 我 们 需要 考虑 那些 破产 发 生 的 情况 ， 令 
A* ={T<r,(n-1)6<U(r) <n6}, 6>0,n=1,2,.… (7.7.12) 
它 是 那些 破产 发 生 并 且 U(7) 宕 0 的 样本 轨道 的 集合 。 


因此 ， 
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P(T<7) = P(T<7r,U(7) <0) +P(T<7T,U(7T) > 0) 











(7.7.13) 
= P(U(7T) < 0) + Sy P(A:) (7.7.14) 
C -、.P(4;) 
= P(U(7T) < 0) + > P(A-) PC 
而 由 已 知 V(r) ~NCz +Hnhror)， 所 以 ， 
四 U(T) - (wu +7) MT _ 二 AT 
PAV(r) <0) = 中 | 
(7.7. 15) 


又 因为 
P(A.) = 「 Pl((n-1)6< U(r) <n6lT = s)dr,(s) 


= 「 Pl((n-1)6 < U(r) -~- U(s) < n6)drF,(s) 


_[z-a(r- 
ee xdF 1(s) 





上 上 -Ds WV2mrar” 去 一 S) 
me 1 C98)2+ p75) 2 
es 

9 0 —s) 


202(7s) dF.(s) + 0(6) 














(7.7.16) 
同 理 ， 
nap 1 (m8)2+[p(7-5)] 
P(A-) = e | 二 i(s) +o(5) 
" V2me (7 -ss) 
(7.7. 17) 
所 以 ， 
EC) (6) (7.7.18) 
PCOA-) 一 e 十 0 Sy A 
2n6p 
于 是 ， 》 P(A:) = > P(A.)[e” +o(5)] 
bd -(n-1)6 (xz-p7-u)2 2n8p 
2 
= Ino T 
> 下 [1 + 0(8)] 
= e 2 x]，* +o 
n=1 ~n8 270°T 
(7.7. 19) 
在 式 (7.7.19) 中 令 6 一 0， 得 
二 0 x-pr -0) 2 +Aprr 
>» P(A*) = | 1 e 2027 dx 
n=1 M27oT 
3 过 
= ec | = 关 | (7.7. 20) 
oT 
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把 式 (7.7.15) 和 式 (7.7.20) 代入 式 (7.7. 14) ， 可 得 





2 十 LT _ 冯 尺 一 人 LT 


yl) = 7 +e a 


Cr 了 
(2) 在 式 (7.7.8) 中 令 7 w 即 可 得 终极 破产 概率 为 J(w) =e 和 <。 
(3) 破产 时 刻 的 条 件 分 布 函数 为 


Fnres (7T)=P(T<TIT<%) Vu,7) 








yu) 

2 尼 十 LT wu 一 AT 

一 ec? 。 中 ee > > 0 
0 

其 概率 密度 函数 为 : 
wu _3 _ -pr) 
万 re (7) 一 Te ?rr ,7T>0 (7. 7. 21 ) 

27ror” 


出 
【 例 7-1】 茶 泊 松 盈余 过 程 的 初始 盘 余 为 w，u 宇 0， 保费 附加 因子 为 
96， 泊 松 强 度 参数 为 和 A， 理赔 额 变量 对 存在 有 限 的 均值 和 方差 ， 试 在 布朗 运 
动 近似 的 条 件 下 写 出 其 有 限时 间 破 产 概率 、 终 极 破产 概率 以 及 破产 时 刻 的 
解 : 设 此 泊 松 盈余 过 程 单位 时 间 内 所 收 的 保费 为 <， 其 净 现 金 流 人 过 程 
为 {2Z(i)，t 宇 01} ， 由 已 知 ， 有 
EL[LZ(i1)|]=[c~-AE(X)]:=0OAE(X): 
Var[ 2(1)] =AE(X’)t 
令 凡 =bAE(E)，o = AE( 有 ) 并 将 其 代入 式 (7.7.8)、(7.7.9) 和 
(7.7.10) 中 ， 则 有 限时 间 破 产 概率 为 : 








wu +0OAE(X)T -22( 8 u— OAE(X)T 
yur) = 中 | -| +e WY .| + |， 
VAE(X')T VAE(X’)r 
uw>0,7>0 
终极 破产 概率 为 : 
_2E(X) 
wl(u)=e EXO uw>0,7>0 


破产 时 刻 7 的 条 件 概 率 密度 薄 数 为 : 


ee (uOAE(X)7) 


friree CT) = ee MBX)r ， T>0 宣 


V27AE(R) 

【 例 7 -16】 已 知 泊 松 僵 余 过 程 的 平均 破产 时 刻 为 10， 理赔 额 变 量 的 
密度 冰 数 为 f(x) = (1 +6x)e“，, x 之 0， 保费 附加 因子 为 8% ， 泊 松 强度 参 
数 为 5 980 ， 求 初始 盈余 的 近似 值 。 

解 : 由 附录 可 知 式 (7.7.21) 是 均值 为 uA， 方差 为 wo/ 的 逆 高 斯 
分 布 的 概率 密度 函数 ， 即 ET =w/p =10， 再 由 已 知 
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0 =0.18,A =5980,E(X) = | (1 +6%)e™dx = 3 
0 


所 以 j=0AE(X) =598， 所 以 w=5 980。 
习题 


1. 证 证 明 性 质 7 -1 和 性 质 7 -2。 

2. 设 理赔 过 程 为 复合 泊 松 过 程 ， 泊 松 参 数 为 信 ， 理 赔 额 变量 为 徊 玛 分 
布 Camma(w，B) ， 试 求 理 赔 过 程 的 矩 母 函数 。 

3. 对 于 定理 7 -2 中 的 式 (7.3.5)， 验 证 破产 概率 汪 (u) 是 附加 费 率 6 
和 初始 资金 已 的 递减 函数 。 

设 盈 余 过 程 中 的 理赔 过 程 为 复合 泊 松 过 程 ， 理 赔 额 变量 服从 均值 为 

1 的 指数 分 布 ，c =4; 又 设 工 为 最 大 聚合 损失 ,到 为 初始 资金 并 且 满 足 已 ( 工 
>z&) =0.05， 试 确定 凡 。o 

5. 设 于 为 某 个 正 实数 点 的 退化 分 布 : P( 于 =xo) =1，xo >0， 试 给 出 式 
(7.3.10) 中 工 的 概率 密度 函数 。 

6. 设 盈 余 过 程 中 的 理赔 过 程 为 复合 泊 松 过 程 ， 理 赔 额 变量 的 概率 密度 


函数 为 p(x) = 了 了 + 一 e “+e “， 又 设 调节 系数 民 满 足 方程 : 
1/ 1 1/ 3 1/ 4 
a a | 4 (3 | 加 | 
试 确定 安全 附加 费 举 6。 
7. 对 于 某 复合 泊 松 理赔 过 程 ， 设 理赔 额 服从 混合 指数 分 布 ， 其 概率 密度 函 





数 为 p(%) =Fe + >0， 又 设 附加 费 率 9 =275， 试 计算 破产 概率 落 (z) 。 


8. 车 破产 概率 为 二 (zu) =0.3e +0.2e”” +0.1e，uv0， 试 确定 9 和民。 

9. 现 有 两 个 独立 的 保险 标的 ， 它 们 都 用 复合 泊 松 过 程 来 描述 ， 其 中 理 
赔 额 都 服从 指数 分 布 且 平 均 理 赔 额 为 10。 又 设 保 险 人 A 和 保险 人 日 分 别 承 
保 了 这 两 个 保险 标的 ,承保 情况 如 表 7 -7 所 示 。 假 定 保 险 人 A 与 .B 进行 了 
合并 ,但 继续 以 同样 的 费 率 承保 了 两 个 标的 ， 试 计算 其 破产 概 闪 。 


表 7 -7 







安全 附加 费 率 
0.4 


0.6 


平均 理赔 次 数 
4 8 


2 











10 





10. 保险 人 A 和 B 共 同 承保 某 种 保险 业务 并 分 别 按 比例 w 和 1-aw 支 付 
每 次 理赔 。 设 聚合 理赔 是 一 个 复合 泊 松 过 程 ， 理 赔 的 密度 函数 记 做 侯 x)， 
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>0。 又 设 保 险 人 A 和 B 收取 年 保费 的 规则 是 使 得 调节 系数 为 固定 值 R 和 
RR。， 试 证 明 使 总 保费 最 低 的 a 为 R,/(R, +R,)。 

11. 计算 泊 松 盔 余 过 程 的 最 大 聚合 损失 上 的 数学 期 望 E(L) 和 方差 Var(L)。 

12. 在 泊 松 盈余 过 程 中 : 泊 松 参数 为 4、 理 赔 额 均 为 5, 单位 时 间 收 取 
的 保费 c=25， 试 计算 : (1) 96 和 (0); (2) 随机 变量 N、L 上 及 上 的 数学 
期 望 和 方差 。 

13. 已 知 某 离 散 时 间 有 和 盈余 过 程 的 条 件 如 下 : w=2， 年 保费 为 2.5, 年 总 
损失 (年 底 发 生 ) 为 独立 同 分 布 的 随机 变量 ， 损 失 量 为 0，,2，4 的 概率 分 
别 为 0.5,0.3 和 0.2。 计 算 w(2，2)。 

14. 设 有 某 复 合 泊 松 理 赔 过 程 ， 其 泊 松 参数 为 A、 理赔 额 变 量 C 服 从 
均值 为 1 的 指数 分 布 ， 附 加 费 举 记 作 08， 又 记 第 nn 次 理赔 或 nn 次 以 前 发 生 破 





产 的 概率 为 小 (w，n)。(1) 试 证 明 y(w，1) = ; (2) 将 W(w，2) 表 示 


为 0 和 以 的 函数 。 

15. 保单 理赔 总 额 是 一 个 复合 泊 松 过 程 ， 具体 数据 如 下 : (1) 通过 核 
保 程序 的 保单 数目 服从 强度 为 每 天 1 000 份 的 泊 松 过 程 ; (2) 对 于 每 份 通 
过 核 保 的 保单 ， 其 被 保险 人 有 20% 的 可 能 性 是 吸烟 者 ，80% 的 可 能 性 是 非 
吸烟 者 ; (3) 保单 的 定价 准则 使 得 每 份 保单 的 期 望 损失 是 -100 ; (4) 对 
于 一 个 吸烟 的 被 保险 人 ， 上 其 理赔 额 方差 为 5 000， 而 对 于 一 个 不 吸烟 的 被 保 
险 人 ， 这 个 数字 是 8 000。 计 算 一 天 内 通过 核 保 的 所 有 保单 理赔 额 的 方差 。 

16. 试 证 明 式 (7.7.21)。 

17. 某 保 险 公 司 用 复合 泊 松 过 程 来 近似 其 盈余 过 程 ， 已 知 光 松 参数 为 


3.5， 理 赔 额 变量 的 密度 函数 为 /(%) =3mre，x >0， 单位， 百 万 元 。 如 


果 保 险 公 司 不 投入 任何 初始 资本 ， 其 破产 概率 为 80% ， 如 果 公 司 希 望 50 年 
之 内 不 发 生 破 产 ， 那 么 至 少 应 该 投入 多 少 初始 资本 ? 

18. 假设 U(n)=wu+tcn-S(n), S(n)= 邢 + 开 +-…+W, 为 时 间 [0,，n] 
上 的 总 索赔 额 。 初 始 强 余 为 1 000 元 ,每 个 阶段 的 保费 收入 为 30 元 。 除 理 
赔 支 出 外 ， 每 个 阶段 保险 人 还 需 支 出 8 元 的 费用 。 已 知 WW ，WW,，…，W， 
独立 ,服从 N(10,，4) 人 分布。 计算 盈余 过 程 的 调节 系数 。 

19. 假设 U(n) =1+1.S -SCn)，S(n) = 肌 ,+ 且 +…+ 肌 为 时 间 
[0, n] 上 的 总 索赔 额 。 对 邢 , 的 分 布 如 下 : P(W,=0) =0.40,P(W,=1)= 
0. 30 ,已 ( 肝 , =2) =0.20,P( 玉 =3) =0.10, (1，2) 为 初始 双 余 为 1 工 的 情况 
下 到 时 刻 2 为 止 的 破产 概 举 。 计 算 ww(1，,2)。 

20. 茶 复 合 泊 松 盈 余 过 程 为 U(+) =w+ct -S(t)， 理赔 额 灾 量 由 期 望 分 
别 为 0.5 和 0.25 的 两 个 指数 分 布 混 合 而 上 成， 权重 分 别 为 75% 和 25%W% 。 给 定 
0=19/21。 计 算 : (1) E[maxso (S(t) -ctl]; (2) 破产 概率 (2)。 
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口 了 解 完 整数 据 、 非 完整 数据 、 分 组 数据 的 和 特点， 熟悉 不 同 数据 情况 
下 的 凤 险 集 与 经 验 生 奉 函 数 的 计算 

口 掌握 非 完整 数据 生存 函数 的 改 aplan - Meier 乘积 极限 估计 、 死 亡 力 
函数 的 Nelson-Aalen 估计 

口 了 解 生 存 函 数 方差 估计 的 基本 原理 以 及 对 数 转换 的 置信 区 间 的 基本 原 
理 ， 掌 握 生 存 函 数 区 间 估 计 、Greenwood 方差 近似 及 相应 的 区 间 估 计 

口 了 解 一 般 核 函数 估计 的 理论 ， 熟悉 大 样本 的 天 aplan - Meier 近似 计 
算 方 法 ， 热 悉 多 元 终止 概率 的 计算 ， 掌 握 三 种 常见 核 函 数 的 密度 估 
计 计 算 


8$8.1 数据 类 型 


根据 数据 完整 程度 的 不 同 ， 精 算 实 务 中 的 数据 集 可 以 分 为 完整 数据 与 
非 完 整数 据 。 


8.1.1 完整 数据 


si 


如 果 能 够 对 概率 分 布 的 任意 点 收集 数据 ， 并 且 能 够 记录 每 个 观测 值 ， 
这 种 情况 称 做 完整 数据 (complete data) 。 例 如 ， 在 生存 分 析 中 ， 当 观察 者 
对 被 观察 对 象 在 每 个 足够 小 的 时 间 单 位 内 进行 观察 ， 直 至 被 观察 对 和 象 全 部 
死亡 ， 并 且 除 死亡 以 外 ， 被 观察 对 象 不 允许 离开 ， 则 得 到 的 生存 数据 就 是 
完整 的 样本 数据 。 例 如 ， 当 免 赔 和 保单 限额 都 不 存在 时 ， 保 险 人 对 保单 损 
失 全 额 支付 ， 这 时 获得 的 保单 理赔 数据 是 完整 的 样本 数据 。 理 想 的 状况 是 
得 到 每 个 观测 值 本 质 上 的 精确 值 ， 这 种 情况 称 为 完整 个 体 数据 (complete 
individual data) 。 当 个 体 数 据 量 过 多 ， 可 以 考虑 对 观测 值 进 行 分 组 ， 只 记录 
观测 值 所 属 的 分 组 ， 则 得 到 的 数据 称 为 分 组 数据 。 

【 例 8-I】 (完整 个 体 数据 ) 这 是 一 组 人 造 的 车 险 赔付 数据 。 假 设 赔 
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付 按照 实际 损失 全 额 支 付 。 表 8 -1 列 出 了 20 个 赔付 额 数 据 样 本 。 











表 8 -1 车 险 赔付 数据 
448 2482 | 2753 | 3786 | 3866 | 3965 | 6315 | 6664 | 6707 | 7947 
8391 | 14540 | 15445 | 15597 | 15602 | 16020 | 22125 | 23879 | 55 122 |220 876 
大 
【 例 8 -2】 “完整 个 体 数 据 ) 这 是 一 组 人 造 的 10 年 定期 寿险 保单 终 


止 时 间 的 数据 集 。 保 单 的 终止 是 指 被 保险 人 身 故 ， 或 者 是 被 保险 人 退 保 
(保单 合约 解除 ) ， 或 者 是 10 年 保单 满 期 。 表 8 -2 列 出 了 从 发 行 之 日 起 观 
测 的 30 份 保单 的 数据 ， 其 中 身 故 时 间 中 的 “一 ”表示 在 观察 期 内 没有 死 
亡 ， 退 保 时 间 中 的 “一 ”表示 观察 期 内 没有 退 保 。 表 格 中 不 仅 详细 给 出 了 
每 个 投保 人 的 身 故 时 间 ， 还 给 出 了 退 保 时 间 〈 只 要 身 故 或 退 保 发 生 在 10 年 
保单 满 期 之 前 )。 在 这 个 数据 集中 ， 无论 投保 人 是 否 中 途 退 保 ， 他 的 死亡 时 
间 都 是 能 够 被 观测 的 ， 因 此 属于 完整 数据 。 当 然 ， 通常 情况 下 我 们 无 法 得 
到 已 退 保 的 投保 人 的 确切 身 故 时 间 ， 也 无 法 得 知 某 个 事实 上 已 经 身 故 的 投 
保 人 如 果 没 有 身 故 将 在 何 时 退 保 。 而 表 8 -2 最 后 10 个 投保 人 在 10 年 内 既 
未 身 故 又 未 退 保 ， 保 单一 直 持 有 到 满 期 。 



























































表 8 -2 10 年 定期 寿险 保单 终止 时 间 
保单 持 有 人 编号 | 身 故 时 间 (年 ) | 退 保 时 间 (年) || 保单 持 有 人 编号 | 身 故 时 间 (年) | 退 保 时 间 (年 ) 
一 0.2 12 5.8 9.2 
2 0.5 一 13 6.8 
3 9.6 1.0 14 6.9 9.2 
4 一 1.6 15 一 6.9 
全 1.6 7.8 16 一 7.2 
6 2.4 5.4 17 8.0 = 
7 6.2 3.6 18 8.5 = 
8 一 1.8 19 8.8 
9 4.2 20 四 9.5 
10 5.0 21 ~30 一 
11 一 5.6 
国 
【 例 8 -3】 (分 组 数据 ) 表 8 -3 是 一 组 普通 责任 保险 保单 的 227 例 
赔 案 的 赔付 额 。 
【 例 8 -4】 表 8 -4 的 数据 集 搜集 了 1956 一 1958 年 间 94 935 个 驾驶 员 
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每 人 每 年 出 现 的 交通 事故 数 0。 注 意 数据 集中 “5 次 以 上 ”是 一 个 分 组 。 



































表 8-3 普通 责任 保险 保单 赔付 额 表 8-4 交通 事故 发 生 数 
赔付 额 范围 (元 ) 赔付 笔 数 赔付 次 数 赔付 笔 数 
0 ~7 500 99 0 81 714 
7 500 ~ 17 500 42 1 11 306 
17 500 ~ 32 500 29 2 1 618 
32 500 ~ 67 500 28 3 250 
67 500 ~ 125 000 17 4 40 
125 000 ~ 300 000 9 5 次 以 上 7 
300 000 元 以 上 3 合计 94 935 








8.1.2 非 完整 数据 


在 实际 中 经 常 得 到 非 完整 数据 。 例 如 ， 如 果 保 单 对 任何 事故 的 赔付 
Rh ne a 
10 万 元 的 保单 的 实际 损失 。 另 一 方面 ， 对 于 250 元 免 赔 额 的 车 险 保单 ， 
保险 公司 不 会 过 问 损失 额 低 于 250 元 的 汽车 损伤 情况 ， 也 不 会 记录 它 
们 的 具体 数据 。 因 此 ， 实 际 工 作 中 得 到 的 保单 损失 数据 大 多 是 非 完 
整 的 。 

非 完整 数据 产生 的 原因 有 两 种 : 删 失 或 截断 。 通 常情 况 下 我 们 对 属于 
某 一 范围 内 的 数据 记录 其 精确 值 ， 如 果 对 超出 该 范围 的 数据 只 记录 其 所 属 
的 范围 ， 则 得 到 的 数据 称 为 删 失 数据 (censored data) ; 如 果 对 超出 该 范围 
的 数据 不 作 记 录 ， 则 得 到 的 数据 称 为 截断 数据 (truncated data) 。 左 删 失 数 
据 (left censored data) 是 指 只 知道 观测 值 在 某 个 给 定 值 之 下 而 不 知道 其 具 
体 值 ; 右 删 失 数据 (right censored data) 是 指 只 知道 观测 值 在 某 个 给 定 值 之 
上 同样 也 不 知道 其 具体 值 。 左 截断 数据 (left truncated data) 是 指 对 低 于 某 
个 给 定 值 的 观测 值 不 作 记 录 ; 右 截断 数据 (right truncated data) 是 指 对 高 
于 某 个 给 定 值 的 观测 值 不 作 记 录 。 

最 常见 的 非 完整 数据 是 左 截 断 和 右 删 失 数据 。 例 如 ， 存 在 免 赔 额 的 非 
寿险 保单 赔付 数据 是 左 截断 数据 ; 存在 赔偿 限额 的 非 寿险 保单 赔付 数据 是 
右 删 失 数据 。 在 生命 表 构 造 中 ， 要 跟踪 每 个 人 的 出 生 和 身 故 是 不 现实 的 ， 
因而 常见 的 做 法 是 在 几 年 的 时 间 内 ， 跟 踪 观 测 一 个 由 不 同年 龄 段 的 人 组 成 
的 人 群 的 生存 状况 。 当 某 人 开始 参与 一 项 生存 研究 项 目 时 ， 他 必然 处 于 生 


@ 数据 来 源 : Dropkin, L. “Some Considerations on Automobile Rating System Utilizing Individual Driving Re- 
cords” , Proc. of the Casualty Actuarial Society, XLVI, 1959, 391 -405., 





存 状 态 ， 且 其 身 故 年 龄 至 少 不 会 低 于 他 参加 该 项 目 时 的 年 龄 ， 因 此 数据 是 
左 截断 的 。 如 果 这 个 参与 者 在 退出 该 研究 项 目 时 还 未 身 故 ， 就 出 现 了 右 删 
失 的 现象 ， 具 体 身 故 年 龄 无 法 确定 ， 但 是 只 能 确定 身 故 年 龄 不 会 小 于 此 人 
在 退出 该 项 目 时 的 年 龄 。 

【 例 8 -5S】 ( 删 失 数据 ) 例 8 -2 中 的 数据 仅 是 理论 上 存在 的 ， 实 际 
中 我 们 只 能 观测 到 某 个 事件 (死亡 、 退 保 ) 的 首次 发 生 时 间 。 我 们 在 此 基 
础 上 新 增 10 位 保单 持 有 人 的 观测 值 ， 这 10 名 保单 持 有 人 是 从 保单 发 行 一 
段 时 间 后 才 开 始 观 测 的 。“ 初 始 观测 时 间 ” 给 出 了 每 张 保 单 的 开始 观测 时 
间 ; “最 后 观测 时 间 ” 给 出 了 每 个 保单 终止 的 时 间 ; “事件 ”一 栏 中 记录 了 
发 生 事件 的 属性 ，s 表示 退 保 ，d 表示 身 故 ，e 表示 满 期 。 得 到 的 数据 见 表 
8 -5。 这 实际 上 是 一 组 删 失 和 截断 都 存在 的 数据 。 对 于 编号 31 ~40 的 保单 
持 有 人 ， 其 死亡 时 间 晚 于 初始 观测 时 间 ， 因 此 是 左 截 断 的 。 另 一 方面 ， 对 
于 退 保 以 及 满 期 保单 的 持 有 人 ， 只 能 知道 其 生存 时 间 大 于 某 一 值 ， 而 不 能 
确切 知道 其 生存 年 数 ， 因 此 是 右 删 失 的 。 


表 8 -5 10 年 定期 保单 观测 数据 集 
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【 例 8 -6】 ( 删 失 数据 ) 表 8 -6 是 以 日 历年 2009 年 为 观测 期 间 得 到 

的 5 人 组 成 的 样本 。 对 每 个 样本 记录 其 生日 和 死亡 日 期 。 对 于 2009 年 内 没 
有 死亡 的 个 体 ， 我 们 无 法 得 到 其 死亡 时 间 ， 因 此 得 到 的 数据 是 删 失 的 。 


* 153， 


表 8 -6 生存 分 析 中 的 样本 数据 


1979.7.1 



















1979. 4.1 











1979. 1.1 


1979.7.1 
1978. 4. 1 


2009. 10. 1 





2009. 4. 22 





$8.2 完整 数 据 情况 下 的 经 验 分 布 函 数 售 计 


个体 数据 


1. 经 验 分 布 子 数 。 为 了 引 和 人 经验 分 布 隔 数 ， 我 们 首先 引入 数据 依赖 型 
分 布 (data dependent distribution ) 的 概念 。 数 据 依 赖 型 分 布 是 一 种 非 参 数 
分 布 ， 它 的 复杂 程度 至 少 与 产生 它 的 数据 或 者 其 他 信息 相当 ， 并 且 其 参数 
个 数 会 随 着 数据 点 或 者 信息 量 的 增加 而 增加 。 数 据 依赖 型 分 布 中 ， 最 简单 
的 分 布 是 经 验 分 布 (empirical distribution) 。 为 研究 某 总 体 分 布 函数 ， 我 们 
从 中 抽取 一 个 样本 量 为 n 的 数据 集 ， 如 果 假 设 每 个 数据 点 的 概率 为 1/n， 则 
得 到 的 分 布 范 数 即 为 经 验 分 布 ， 其 计算 公式 为 : 





天 (而 = 5 L1(%, < *) 二 (8.2.1) 


n 
其 中 : 1(* ) 为 示 性 函数 ，# 表示 集合 4 中 元 素 的 个 数 。 
观测 值 x, 中 可 能 包括 相同 的 数值 ; 我 们 记 其 中 有 天 个 不 同 的 数值 ， 
yi <y <… <Y， 并 且 记 ss =# {x,: x 一 y| 表示 取 值 y 的 观测 值 的 个 数 。 容 . 
易 知 道 : s +s +… +s; =n。 则 经 验 分 布 又 可 以 写成 : 


F(x) = Dp (8. 2. 2) 


经 验 分 布 概率 范 数 (empirical distribution probability function) p,(x) 定 
义 为 取 值 x 的 观测 值 的 个 数 。 显 然 ， 


5 


一 T= 


Pp.(%) = 7 (8.2.3) 

0， x= 其 他 

并 且 p,(x) 和 FF,(x) 的 关系 为 : 
F(x) = DP) (8.2.4) 


注意 式 (8.2.2) 和 (8.2.4) 是 一 致 的 。 
【 例 8 -7】 假设 样本 数据 x,，x,，…， xs 为 7、2、4、4、6、2、1、 
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9。 求 在 各 个 观测 值 上 的 经 验 概率 。 

解 : 将 数据 排序 ， 可 以 得 到 6 个 不 同 的 观测 值 : y, =1，7 =2，7y; =4， 
y=6, ys;=7, ye =9o 

相应 地 观测 个 数 为 : s, =1, s, =2, s; =2, s,=1, s;=1, 
而 有 : 

ps(1) = 癌 , Pi(2) = 于， Se 革 , pi(6) = 癌 ， ，ps(7) = 豆 ， , ps(9) 二 


s =1。 从 


【 例 8 -8】 利用 例 8 -1 中 的 数据 绘制 经 验 分 布 函 数 图 ， 并 计算 
F,,(10 000) 。 
解 : …#| xi<10 0001 =11, n=20 … Fo(10 000) = 区 =0 55 


绘制 的 经 验 分 布 函 数 图 见 图 8 -1。 从 图 8 -1 中 可 以 看 出 ， 经 验 分 布 函 
数 实 际 上 是 一 个 在 每 个 数据 点 跳跃 的 阶梯 消 数 ,在 观测 值 y, 处 跳 路 值 为 


Pa.(Y;) = s/no 站 


累积 分 布 经 验 分 布 


© 
© 
9 
© 
© 
© 
© 
© 
© 
© 
© 





0 50000 ”100000 ”150000 ”200000 ”250000 赔付 额 


图 8-1 例 8-L 的 经 验 分 布 函数 


经 验 分 布 孙 数 作为 分 段 常数 孙 数 的 这 一 性 质 对 总 体 分 布 的 推断 意义 不 
是 很 大 ， 因 为 总 体 分 布 洱 数 几 乎 总 是 严格 递增 和 的。 事实 上 ， 经验 分 布 孙 数 
的 阶梯 式 增加 是 由 于 样本 容量 的 有 限 性 ; 可 以 推断 ， 如 果 样 本 容量 无 限 增 
大 ， 经 验 分 布 函 数 阶 梯 的 “个 数 ” 也 就 不 断 增 大 ， 而 “幅度 ”不 断 减 小 ， 
因此 得 到 的 曲线 也 会 更 加 平滑 。 因 此 实际 工作 中 可 以 用 拟 合 这 些 降 幅 的 光 


“1535 


精算 模型 


' 136 ， 


滑 曲 线 来 调整 图 8 -1 中 的 曲线 。 这 一 调整 过 程 称 为 修 义 ， 它 是 推导 总 体 分 
布 函数 F(x) 程序 的 一 部 分 。 在 此 ， 我 们 只 考察 F(x) 的 初始 估计 量程 序 
而 不 进行 修 义 。 

2. 风险 集 与 经 验 生 存 函 数 。 和 经 验 分 布 函数 对 应 ， 经 验 生存 函数 (em- 
pirical survival function) S,(x) 指 的 是 对 生存 时 间 大 于 x 的 概率 的 估计 ， 即 大 
于 zx 的 观测 值 点 总 体 数 据 集 的 比例 。 经 验 生 存 函 数 的 定义 是 : 

S (x) =1— F(x) (8. 2. 5) 

由 式 (8.2.1) 和 (8.2.5) 知 : 


#{x, 志 x} _#{x,>x| 





S,(x) =1 -F(x)=1 


在 观测 值 y 处 的 风险 集 (risk set) 是 指 不 小 于 y 的 观测 值 组 成 的 集 
合 ， 记 做 : 
r= {wry)| (8. 2.6) 
在 生存 分 析 中 ， 由 于 观测 值 为 个 体 的 存活 时 间 ， 因 此 观测 值 y 处 风险 
集 是 指 在 时 刻 y 面临 死亡 风险 的 被 观测 者 的 全 体 。 这 些 被 观测 者 在 时 刻 y 
死亡 ， 或 者 以 后 在 y 死亡 。 它 们 构成 时 刻 y, 死亡 事件 的 风险 暴露 组 。 在 理 
赔 额 模型 中 ， 观 测 值 为 理赔 额 的 数值 ， 理 赔 额 y, 处 的 风险 集 表示 理赔 额 可 
能 大 于 等 于 y 的 观测 对 象 的 集合 。 
在 计算 中 ， 我 们 也 用 -r 表示 观测 值 y 处 的 风险 集 的 大 小 ， 即 
r=# {x,: xy (8.2.7) 
由 式 (8.2.2) 知 : 


r = 3 (8. 2.8) 
由 式 (8.2.2)、 (8.2.5) 和 (8.2.8) 知 ， 经 验 生 存 函 数 也 可 如 下 计算 : 
S (xz) = ,yr < (8. 2.9) 
相应 的 经 验 分 布 旺 数 为 : 
P.(%) =1 -<% < (8. 2. 10) 


【 例 8-9】 利用 例 8 -7 的 数据 ,计算 各 个 观测 值 处 的 风险 集 大 小 ， 
并 绘制 经 验 生存 小 数 的 图 形 。 

解 : 由 式 (8.2.8), 将 si =1，s =2，s =2，ss =1，s =1， ss。 =1 代 人 得 : 

3 > 5=8， 一 > s =7， 同 理 得 : mm =5, 7 =3, r=2, re=1。 
经 验 生 存 函 数 图 见 图 8 -2。 

3. 经 验 分 布 叉 数 的 统计 分 析 。 经 验 分 布 函 数 忆 .(x) 是 对 总 体 分 布 F(x) 
函数 的 一 种 估计 量 ,， 下 面 研 究 它 的 统计 性 质 ， 首 先 看 它 的 相合 性 。 由 式 
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经 验 生 存 函 数 


涤 现 了 寺内 





图 8 -2 例 8-9 中 的 经 验 生存 函数 


(8.2.1): 
#1{x, x| 


nn 


F(x)= > T(x x) = 


其 中 每 一 个 加 项 都 独立 并 且 服 从 两 点 分 布 I(x, 万 x) ~ B(F(x))， 因 此 #1{x， 
去 寻 服 从 二 项 分 布 呈 (nz，FGx)): 因此 ， 
E[I(x,<x)] =F(x) (8.2.11) 
Var[ I(x,<x)] =F(x)[1—- F(x)] (8. 2. 12) 
将 式 (8.2.11) 、(8.2. 12) ， 代 人 式 (8.2.1)， 得 到 : 
1 
E[LF,.(x)] = 之 二 BELTCxsx)] = 》 Fx) =F(x) (8. 2.13) 


i= ial 


Var[ F,(%x)] = Var[ > 17(x,<*)] -三 > Var[ I(zx,<x)] 
EE en 
n 
即 Var[ F(x)] = F(x)S(%) (8. 2. 14) 


因此 ，F.,(x) 一 F(x)， 经 验 分 布 函 数 F,(x) 是 对 总 体 分 布 (x) 范 
数 的 无 偏 一 致 佑 计量 。 
实际 计算 中 ,方差 的 估计 可 如 下 计算 ; 


Var[ F(x)] = TF,(%)S,(%) (8.2.15) 
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类 似 地 ， 可 以 得 到 经 验 生 存 郴 数 的 相合 性 : 
E[S,(x)] =S(x) 


Var[ S,(x) | = 二 F(z)S(x) (8.2. 16) 
以 及 方差 的 估计 : 
Var [S.(z)] =EF,(x)S.(x) (8.2.17) 


在 使 用 经 验 估计 时 ， 有 时 我 们 关心 概率 p=Pfa< 针 <61 的 估计 。 此 时 
P 的 经 验 估计 为 p = fF,(b5) - Ff,(a)。 与 上 文 的 推导 类 似 ， 可 以 知道 E(P8) = 


p，Var($) =2--P)， 即 估计 量 也 是 相合 的 。 


对 于 一 般 的 经 验 估计 B， 由 中 心 极 限定 理 ，2 近 似 地 服从 正 态 分 布 : 
PpP-p _. (Pp-p) dN(0, 1) 


VVar(p) pll -p/n 
因此 p 的 100(1 -a)%% 的 置信 区 间 可 通过 求解 如 下 不 等 式 得 到 : 








< (p=8) < (8.2.18) 


其 中 ws 是 标准 正 态 分 布 的 100(1 -av2) 和 分 位 点 。 有 时 这 样 做 是 很 困难 的 
(因为 p 出 现在 分 母 中 )， 所 以 如 果 必 要 时 可 以 将 式 0 2.18) 分 母 中 的 p 
用 BP 代 兰 ， 从 而 得 到 如 下 近似 置信 和 区间: 


A a 
Up £ > s+ un £ 


【 例 8 -10】 利用 例 8 -2 中 的 数据 ， 用 经 验方 法 估计 ,,g 和 g, 并 计算 
佑 计量 的 方差 。 

解 : 注意 ,,q 和 g, 是 不 同 的 ,,,q 是 个 体 在 第 三 年 死亡 的 概率 ， 而 9, 是 个 
体 在 活 过 两 年 的 情况 下 在 第 三 年 死亡 的 概率 。 如 果 用 表示 在 0 ~2 之 间 身 


故 的 人 数 ，N 表示 在 2 ~3 之 间 身 故 的 人 数 ， 则 可 以 得 到 :8 = 全 ,人 = 








(8.2. 19) 


二 iz。 数据 集中 的 n=30， 因 此 ， 


219(1 ~—219) 29 ~ 1 1 


33 22 -30 一 人 一 28 


a 1 ~ 
9 =Sy(2) -So(3) =-30， Var(2,9) = i -303 


对 于 , 的 方差 rar(3) = yar 于- 让] 般 常 是 无 法 求 得 的 ， 因为 M 取 值 为 


n 的 概率 为 正 数 。 通 常 的 做 法 是 求 取 条 件 方 差 ， 即 给 定 M =2 的 条 件 下 的 方 
差 ， 此 时 有 : 


28、_ (1/28) (27/28) 


Var(g, | S$,.(2) =30) 三 78 





=0.00123 国 
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例 8 -10 的 结果 可 以 推广 到 一 般 情形 。 假 设 最 初 样本 量 为 n，n, 为 时 刻 
x 存活 的 个 体 数 ，n,,, 为 时 刻 x +n 存活 的 个 体 数 ， 则 ,gq, 表示 x 岁 生 存 的 人 
在 x +n 岁 前 死亡 的 概率 ， 则 
S(x)—S(x+n) 





.gq,. =P(x <X<x+t+n|x>x) = 








S(x) 
因此 ,g, 的 估计 值 为 : 
从 n, Ts 
nde 
.9: 的 条 件 方 差 的 估计 为 : 
一 - 工 - nr 
[Gr [9.| 在 x 时 刻 有 吕 个 人 ] = 全 一 


【 例 8 -1L1】 计算 例 8 -10 中 ,,g 的 95% 置信 区 间 。 
解 : 将 us =1.96， ,9= 贡 ;m=30 代入 式 (8.2.18) 中 ， 解 得 95% 和 时 


信和 区间 为 0. 0059 <,,g <0.1667。 若 代入 式 (8.2.19)， 得 到 近似 的 区 间 为 
( -0.0309 ，0.0976 ) 。 国 


8.2.2 分 组 数据 


1. 卵 形 线 和 直方 图 。 对 于 分 组 数据 ,根据 之 前 的 定义 构造 经 验 分 布 也 
数 是 不 可 能 的 。 但 是 ， 仍 然 可 以 近似 估计 经 验 分 布 函数 ， 方 法 是 利用 插值 
方法 和 估计， 其 中 最 常见 的 方法 是 线性 插值 。 

假设 分 组 数据 的 分 界 点 为 ce。<c, <… <c， 其 中 c=0, c,=%， 落 在 


cj 与 6 之 闻 的 观测 值 有 诈 个 ， 则 有 : 2》n = n。 对 这 样 的 数据 ， 经 验 分 布 
函数 在 分 界 点 处 的 值 为 : 


Ea 


F,(c,) = > n/n (8. 2. 20) 


注意 : 要 使 fF,(c) 成 为 经 验 分 布 范 数 ， 由 分 布 函 数 的 右 连 续 性 ， 应 当 
保证 分 组 数据 包括 左 端点 ci 不 包括 右 端 点 cj。 

为 了 计算 分 布 函数 在 任意 观测 处 的 取 值 ， 可 以 采用 线性 插值 法 ， 得 到 
的 估计 值 叫做 经 验 分 布 光滑 曲线 ,简称 卵 形 线 (ogive)。 计 算 公 式 为 : 


一 Ci-1 








C 一 邯 x 
F(x) = 一 天 (ci ) 十 


Ci 一 Ci 


Flc), ci<x<e, (8.2.21) 
si 


该 隆 数 是 几乎 处 处 可 导 的 ， 因 此 可 以 人 为 地 将 其 密度 渗 数 定义 为 右 连 
续 的 函数 即 可 ， 得 到 的 密度 函数 称 为 直方 图 (histogram)。 计 算 公 式 为 : 
f£.(x) TE cx<e, (8.2.22) 


n(c,~ ce.1) 2 


注意 ， 这 里 定义 的 直方 图 ， 其 组 距 可 以 是 不 同 的 。 很 多 计算 机 程序 生 
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成 的 直方 图 其 实 只 是 柱状 图 ， 柱 的 高 度 和 频数 成 比例 。 在 区 间 长 度 相 同 的 
情况 下 ， 这 种 方法 是 可 以 接受 的 ， 但 是 当 区 间 长 度 不 同时 ， 就 必须 使 用 公 
式 〈8. 2. 22) 进行 计算 。 这 种 方法 的 优点 是 : 直方 图 确实 代表 密度 函数 ， 
而 且 直 方 图 下 面 的 面积 可 以 代表 经 验 概率 值 。 

【 例 8 -12】 利用 例 8 -3 中 的 数据 ， 构 造 卵 形 线 绘制 直方 图 。 


解 : 分 布 函 数 为 : 
0. 000058150x ， 0<x <7500 
0. 29736 + 0. 000018502x, 7 500<x<17 500 
0. 47210 +0.000008517x*, 17 500=<x<32 500 
F(x) =10.63436 +0.000003524x, 32 500=<x <67 500 
0. 78433 +0.000001302x, 67 500=<x <125 000 
0. 91882 +0.000000227x, 125 000<x <300 000 
未 定义 ， x 宇 300 000 
由 于 孵 形 线 是 分 段 线性 的 ， 其 导数 的 计算 是 显然 的 ， 此 处 从 上 略 。 相 应 
的 直方 图 见 图 8 -3。 加 
【 例 8 -13】 考察 一 个 在 上 =0 处 有 20 个 个 体 的 样本 ， 所 有 个 体 均 在 5 


局 内 死亡 ， 并 且 只 记录 每 周 死亡 的 人 数 。 在 5 周 内 死亡 的 人 数 分 别 为 : 2， 
3，8，6，1。 运 用 所 给 数据 估计 4 ， 并 绘制 直方 图 。 


解 : g, 是 在 第 3 周末 存活 的 人 在 第 4 周 死亡 的 概率 。 因 此 加 = 人 。 相 应 
的 直方 图 见 图 8 -4。 


fx) AD 

6x10” 0.4 
5x10” 03 
4x105 

3x107 02 
2x10” 

1x10” Ql 

" 0 50000 100000150000200000250000300000 0.0 Xx 
Xx 0 1 2 3 4 和 


图 8-3 例 8-13 中 赔付 额 分 布 的 直方 图 图 8-4 例 8-14 死 亡 时 间 分 布 的 直方 图 


LJ 
2. 密度 估计 的 性 质 。 设 N, 表示 落 在 ,和 。 之 间 的 观测 值 个 数 。N,， 
N, ，…,N, 服从 联合 多 项 分 布 ， 其 联合 概率 函数 为 : 


nl! 


rr [Fe) -Fcs))” (8.2.23) 


pn ma ,Ts ) ep 


ml n,! 
从 而 其 边际 分 布 为 二 项 分 布 : 
N,~B(n,F(e) -Fle,.,)) (8. 2. 24) 
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在 时 刻 c ,前 死亡 的 总 人 数 的 分 布 为 : 
> WB 罗 (8. 2. 25) 
因此 ， 
E(N,) =n(F(e) - Fle 1)) ,Var(N,) =n(F(c) -Fe.))(1-F(e) +F(e,.,)) 
El > N, | = nF(c), var (SF N, | ee 


由 式 (8.2.21) 知 ， 对 于 cx<oe, 
Flc,) -FF,(c,.,) 








F(x%) =F,(c) + (x%~c.1) 
Cj TO-i 
1 1 nm (x%—c,.1) 
a > n 小 于 本 | 
将 以 上 结果 代入 得 
Fl(c)—F(e, Fy 
E(F,(x)) es eT RL (0) -Fle)] %-o 
| 轨 《ci Ci 1) 
CR X 一 Ci 
Sh Rn ee (8. 2. 26) 
5 一 Ci-1 i 


当 x 关 cj-! 时 ， 这 个 估计 是 有 偏 的 。 其 方差 计算 比较 复杂 : 
es (xc 2(xz -6c.1) - 
Var( F, (x)) = 二 tr 人 > w 】 人 小 本 | AN N ) 


(x% -01 >》 


7 《ci 一 -1 ) {nl Flo) -Fo )] 


2 
rn (oc -0.-1) 


-六 fnF(o-)[1 -Fo )]i+ 


人 [1 —Ftc,) +F(c..)|| + | -nF(c_1)[LF(c) -F(c.,)]} 


ee A ee (Fo) 
-Flo.1)) 1} 


= 二 FPC- ) + (一 和 ) [F(e) -Fe -EEC (8. 2. 27) 


Ci 了 -1 


类 似 地 ， 代 和 人 式 (8. 2. 22)， 得 到 : 


Flc)—F(ce, 
ELf.(#)] = 





,C1 SX < (8.2.28) 
Varf (HJ = tS (8.2.29) 
Var[/.(x) ] 的 估计 值 为 : 
xX)(1-— 
a Cap 





CX<e, 
mc 一 cl) 站 i 


这 些 结果 和 完整 个 体 数 据 的 估计 都 是 基于 二 项 分 布 进行 的 ， 因 此 结果 
也 是 一 致 的 。 
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【 例 8-14】 在 例 8 -13 中 的 样本 , 已 知 m +m =7 表示 第 三 周末 的 存 
活 人 数 是 7。 

(1) 假定 样本 的 生存 分 布 为 (0, 5] 上 的 均匀 分 布 ， 求 Var(,,9) 和 
Var(p, | m +m =7) 

(2) 若 生存 分 布 未 知 ， 求 Var(,, 2 ) 和 Tor(5 | ns+ns) 的 估计 。 

解 : (1) 若 生 存 分 布 为 均匀 分 布 ， 则 ,, qo。= Ff(3) -Ff(2) =0.2，P = 





S(4) 
=0.5。 
a 
Var( ,9,) _ ago 219o ) _0.2 x0.8 -0 008 
n 20 
We 
Var($, | n, +n,) _Ps( ps) -0.5x0.5 0 03571 





n+ns 7 
(2) 以 ,名 =0.4， 所 = 方 代入 方差 估计 式 ， 得 到 : 


Var( ,96) =29o(1 — ,qo0)/n =0.012 ， 


Var($, |n, +m =7) =p(1 -Pp)/(n, +n;s) =0.01749, 加 
【 例 8-1S】 利用 例 8 -4 的 数据 ， 计 算 A(1) 的 方差 。 
解 : 利用 式 (8.2.30) 计算 ,其 中 n=94 935，c, =2，c, =1， 


11 306 
大 41) “94 935 x (2 -1) 


£1) (1 -ff.(1)(2-1)) 
94 935 x (2—1) 


=0. 11909 。 得 到 : 


=1.10506 x10™ 站 





Var(f.(1))= 


8.3 非 完 整数 据 情况 下 的 经 验 分 布 本 数 信 计 


8.3.1 风险 集 


为 了 用 删 失 或 者 截断 的 数据 来 构造 经 验 分 布 函 数 ， 第 一 个 任务 是 明确 
一 些 记号 来 表示 与 数据 信息 相关 的 量 。 对 于 个 体 数据 ， 如 下 两 个 因素 是 必 
须 考虑 的 : 

1. 数据 观测 值 的 截断 点 ， 用 d) 表示 ， 如 果 没 有 截断 发 生 ， 则 dj =0。 

2. 数据 观测 值 本 身 。 在 理论 研究 中 ， 对 于 每 一 个 观测 对 象 ， 都 假定 存 
在 一 个 事件 发 生 点 % 和 删 失 值 w， 但 是 能 够 被 观测 的 只 能 是 二 者 中 的 较 小 
值 ; 因此 ， 如 果 该 数据 是 删 失 值 ， 将 其 值 记 为 uw,， 否则 记 为 x,。 

和 完整 数据 的 情形 类 似 ， 把 未 被 删 失 的 观测 值 x, 中 包括 的 所 有 大 个 不 
同 的 数值 记 做 y, <y, <-… <y,， 并 且 用 s, 表示 这 些 y 出 现 的 次 数 。 和 完整 数 
据 不 同 的 是 风险 集 7 的 计算 。 在 生存 模型 中 ， 风 险 集 是 由 那些 在 指定 年 龄 


第 八 章 ”经 验 模型 


仍 处 于 被 观察 状态 的 个 体 构 成 。 在 观测 值 y 时 刻 的 风险 集 包 括 : 

(1) 死亡 时 间 在 yy 或 y; 以 后 的 个 体 ; 

(2) 删 失 时 间 在 yy, 或 y, 以 后 的 个 体 。 

但 是 ， 对 于 那些 在 y, 以 后 才 首 次 被 观测 到 的 个 体 ， 我 们 认为 其 在 时 刻 
y; 并 没有 处 于 被 观测 状态 。 因 此 ， 对 于 风险 集 大 小 的 计算 公式 为 : 


r; =#|x,:x, 7y,| +#{u,:u,>=7y,| —#|[d,:d,>7,|} (8.3.1) 
另外 ， 注 意 到 : 
n=#|x,| +#{u,} 二 #1 x,:Xx, 宇 ,| +#{x,:x, <y,|} +#|u.:u,>7y,} 


+#{u:u, <y,| =#{d} =#{d,:d,>7y,| +#{d,:d, < yi 
因此 , 式 (8.3.1) 也 可 写 做 : 
r=#{d,:d, <y —#{x,:x, <yY} —#|u,:u, <y,| (8.3.2) 

在 数据 没有 删 失 和 截断 的 情况 下 ， 容 易 知 道 , 式 (8.2.7) 是 式 
(8.3.1) 、(8.3.2) 的 特殊 情形 。 式 (8.3.2) 从 直观 意义 上 更 加 容易 理 
解 ， 因 为 它 是 由 所 有 在 给 定年 龄 之 前 被 观测 的 个 体 减 去 已 经 离 去 的 个 体 数 。 
此 外 ， 实际 计算 中 ， 如 下 的 弟 推 公式 可 以 使 计算 更 加 方便 : 

r; =r +#{d,:y, ,<d, <y| -#{x,:y, <x <y} —#lu,:y,, <u, <y,| 
(8. 3.3) 
其 中 规定 m =0。 

在 损失 模型 中 ， 如 果 观 测 值 是 损失 额 。 风 险 集 就 是 损失 观测 值 (实际 
金额 或 者 由 保单 限额 决定 的 最 大 金额 ) 大 于 或 者 等 于 Y 的 保单 数 减 去 免 赔 
额 大 于 或 者 等 于 7Y 的 保单 数 ， 计 算 公 式 同 上 。 

【 例 8 -16】 对 例 8 -5 的 数据 ， 同 时 利用 式 (8.3.2) 或 (8.3.3) 
计算 以 上 定义 的 各 种 量 。 

解 : 计算 结果 列 于 表 8 -7 和 表 8 -8。 


表 8 -7 例 8 -16 的 数据 
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表 8-8 例 8 -36 的 风险 集 计算 
了 yi 5 rT 
1 0.5 1 30 -0 -1=29 或 0+30-0-1=29 
2 1.6 1 32 -1 -2=29 或 29+2-1-1=29 
3 2.4 1 33 -2 -3=28 或 29+1-1-1=28 
4 5.8 1 35 -3-8=24 或 28+2-1-5=24 
5 6.2 1 37 -4 -8=25 或 24+2-1-0=25 
6 6.9 1 38 -5 -9=24 或 23+0-1-0=24 
7 8.0 2 40 -6-12=22 或 24+2-1-3=22 
-一 
8 8.2 1 40 -8 -12 =20 或 22+0-2-0=20 
一 一 -一 下 一 一 上 
9 8.5 1 40 -9-12 =19 或 20+0-1-0=19 


(一 ) Kaplan - Meier 估计 的 推导 

在 给 出 了 风险 集 概 念 的 基础 上 ， 我 们 就 可 以 对 生存 函数 作 进 一 步 估计 。 
最 常用 的 方法 是 Kaplan - Meier 乘积 极限 估计 (Kaplan - Meier product - linait 
Estimator) ， 它 是 由 Kaplan P. 和 Meier E. 在 1958 年 提出 的 。 其 估计 生存 落 
数 的 方法 是 : 首先 ， 把 未 被 删 失 的 观测 值 x; 中 包括 的 所 有 天 个 不 同 的 数值 
记 做 y <y: <… <yioe 其 次 ,对 于 上 <y 的 值 ， 因 为 在 y 之 前 没有 人 身 故 ， 
所 以 认为 SC) =1。 然 后 ,在 7y, 时 刻 的 死 立 事件 发 生 以 前 ， 风 险 集 为 7， 
它 表 示 可 能 有 m 人 会 面临 死亡 风险 ， 而 实际 死亡 的 人 数 为 s,。 因 此 ， 活 过 
时 刻 y 的 概率 为 一 ， 这 就 是 5S(y,) 的 值 。 在 和 入 之 间 的 时 刻 ， 没 有 
新 的 死亡 发 生 ， 因 此 在 这 个 时 间 段 内 生存 丽 数值 保持 不 变 。 而 在 时 刻 y,， 

72 一 S2z 


由 相同 方法 知道 活 过 这 个 时 刻 的 条 件 概 率 为 P{T>y,|7>y| = 一 ， 而 
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-号 -一 一 一 一 -一 ~ 一 一 CC 一 一 
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我 们 假设 观察 对 象 之 间 是 相互 独立 的 ， 因 此 S(y,) =5(y,) 





。 继 续 以 上 


1 


推导 ， 就 可 以 得 到 Kaplan - Meier 乘积 极限 公式 : 





1 ， 0 和 上 <y》， 
人 TS 2 :二 天 
-一 一 < yy 去 
Su ed Ws i (8. 3.4) 
TT; 一 Si 
11 或 0， 上 三 入 


值得 注意 的 是 ， 当 i 二 y 时 5,(i) 的 值 。 如 果 s, = 关 ， 则 当时， 该 
样本 中 的 所 有 个 体 都 在 y, 之 前 身 故 ， 因 此 从 经 验 上 看 ，5,(i) =0。 但 是 由 
于 删 失 的 存在 ， 可 能 在 最 后 一 个 身 故 时 刻 被 观察 以 后 ， 仍 有 个 体 生 存 ， 而 


这 些 个 体 在 x 以 前 被 删 失 了 ， 因 此 在 y 以 后 的 生存 函数 无 法 估计 。 对 于 这 
种 情况 有 三 种 方法 。 第 一 种 解决 办 法 是 取 最 后 得 到 的 函数 值 [] 一 作为 5 


(1) 的 估计 ， 这 种 方法 得 到 的 估计 量 是 有 偏 的 ， 而 且 当 s% <r 时 ， 利 用 生 
存 清 数 求 取 分 布 的 矩 时 所 作 的 广义 积分 发 散 ， 这 个 性 质 是 不 理想 的 。 因 此 ， 
有 时 我 们 也 采用 第 二 种 办 法 ， 即 规定 在 和 以 后 的 所 有 取 值 都 为 0， 这 种 方 
法 得 到 的 估计 量 也 是 有 偏 的 ， 但 是 可 以 用 于 计算 各 阶 矩 。 第 三 种 方法 是 折 
中 的 方法 ， 即 选择 一 条 指数 函数 衰减 的 曲线 去 拟 合 y 以 后 的 生存 晒 数 。 令 





w=maxlyi， ww， 由， ， 对 上 >w， 规 定 S.(i) 人 其 中 
二 [I 2 由 指数 函数 的 性 质 ， 此 时 的 经 验 分 布 范 数 对 各 阶 抢 的 积分 都 


是 收敛 的 。 

还 要 注意 ,在 式 (8. 3.4) 中 的 S,(t) 和 经 验 生存 函数 式 (8.2.9) 的 
符号 是 相同 的 。 这 并 不 会 引起 混淆 ， 枯 为 在 完整 数据 的 情况 下 ，Kaplan - 
Meier 估计 式 (8. 3.4) 正好 退化 为 经 验 分 布 汞 数 〈8. 2.9) 。 在 完整 数据 的 


情形 ， 所 有 观测 值 均 为 x,， 并 且 d =0。 因 此 ，r =m，r, = Ds ，r, 一 5 = 2 5 


od Zs i 将 这 些 关 系 式 代 人 式 (8. 3.4) ， 有 


1 ， 0 和 上 <》 





Fs 
[] 二 三 -一 i<y,j<k 
S,.(t) = 1 ia 


rT 
itl 大 

[人 = 一 ， t 之 Yi 
T, nn 


i=1 


(8.3.5) 


此 处 的 式 (8.3.5) 显然 和 式 〈8.2.9) 是 等 价 的 。 
【 例 8 -17】 利用 Kaplan - Meier 方法 对 例 8 -5 中 的 数据 的 生存 孙 数 
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人 SS 
进行 估计 。 
解 : 利用 例 8 -16 的 结果 ， 代 人 计算 得 到 : 
有 0O<:<0.5 
(29 -1)/29 =0. 9655, 0.5<1:<1.6 
0.9655(29 -1)/29 =0.9322, 1.6<:<2.4 
0.9322(28 -1)/28 =0.8989, 2.4<t1<5.8 
0. 8989(24 -1)/24 =0.8615, 5.8<t1<6.2 
S (ti) = 0.8615(25 -1)/25 =0.8270, 6.2 到 上 <6.9 
0. 8270(24 -1)/24 =0.7925, 6.9<1<8.0 
0.7926(22 -2)/22 =0.7205, 8.0<:<8.2 
0.7205(20 -1)/20 =0.6845, 8.2<1<8.5 
0.6845(19 -1)/19 =0.6485, 8.5<:<10.0 
0.6485 或 0 或 0. 648555 ， 1 之 10.0 
铀 
(二 ) 方差 估计 


Kaplan - Meier 公式 本 质 上 分 为 如 下 两 个 步骤 : 
首先 将 生存 也 数 分 解 成 一 系列 条 件 概率 的 有 习 积 ,再 对 每 个 条 件 概率 进 
行 估计 ， 即 : 


SCi) =P{T>i} = II P{T>yIT>y;}, yt<y,, jek (8.3.6) 
其 次 ， 构 造 每 一 个 条 件 概 率 的 无 偏 估 计 : 
入 7 一 Si 





已 | 了 >yil 了 > = (8.3.7) 


rs 
由 死亡 事件 的 独立 性 ,将 式 (8.3.7) 代入 式 (8.3.6) 便 得 到 估计 公式 
(8.3.4) 。 
对 于 式 (8. 3.7) 的 估计 ， 注 意 到 7, 是 在 年 龄 y, 时 面临 身 故 风险 的 个 
体 总 数 ， 每 个 个 体 风险 事件 发 生 的 概率 相互 独立 ， 因 此 风险 事件 发 生 的 总 
数 s, 服从 二 项 分 布 : 
s,~B(r,l -PIT>y.IT>y,,}) 














S(y, 
其 中 , P{T>y.I7T >yl -3 因此 ， 
mS; _ri—nll —S(y:)/S(y:.1)] 二 S(y:) 
人 7 “SC en 
rar 人 -3 yaur(si) _nll —S(y,)/S(y,1)]S(y.)/S(y.,.,) 
三 [LS(y,.,) —S(y.) ]S(y.,) (8 3 9) 





nS(y.1)’ 
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在 指定 的 死亡 时 刻 六 处 的 生存 概率 估计 值 5,(y;) 是 无 偏 的 ， 这 是 
因为 : 








i ( ; 
-了 (= 肛 记 坟 =- 吉 澡 


而 在 没有 死亡 事件 发 生 的 时 刻 ， 生存 概率 si) 的 估计 值 是 有 偏 的 ， 偏 
误 为 : 








ELS,(y,)] = | [1 


ELS,(i)] -S(t) =S(y,..) 一 SC) ， yi- Et<y, 
下 面 我 们 计算 在 死亡 时 刻 y, 处 估计 量 的 方差 。 推 导 的 过 程 需 要 用 到 如 
下 两 个 性 质 : 
1. 设 和 ， 和 ，…， 天 是 相互 独立 的 随机 变量 ,，E(X,) =j,, Var(X,) = 
oio。 则 有 
Var( XK) = EC(XX- HX ) [EC(XX,…X,.)]? 
=E(X)E(X)-E(X) — (EX,) (EX,) (EX,)’ 


= Jo re) -I 
2. 车 al，i -1, 2，.…， 相对 于 菜 一 常数 p 均 为 高 阶 无 穷 小 ，a. - 
ol(p)， 则 
ITa +a) =1+ yg + ol(p’) 
由 以 上 两 条 性 质 ， 即 可 进行 方差 的 近似 计算 : 
ar[S.(y)] = Var| IT 人 2 一 |]| 














_ i SO) [Sy) 2 : | S (y:)” | 














SC7 iD) riS (7 1 AS Ca 
JrS() + [SCy) -SCy)1S(y)] SO) 
H[| rsS(y..)’ | SC7o) 
Se [ SCy)* ris(y) + [SO ) 2 SO 
=1 SCO7 riS(C7i) SCyo) 
_ 3(%) [了 S(yi1) - SG)] 
en le 
S(y) ww S(yi1) - S(y,) 
本 ns (8. 3. 10) 
Tr.—s, S 
注意 到 站 是 就 的 估计 ， 将 其 带 入 式 (8.3.10)， 就 得 到 了 
Greenwood 近似 公式 (Greenwood approximation ): 
Var[ S,(y,)] =S. (7 六 二 (8.3.11) 


Greenwood 近似 公式 可 以 拓展 到 一 般 的 时 刻 上 的 情形 : 
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Si 


Var[ S.(1)] =S,(1)’ (8. 3. 12) 


i Ti Ti — 5;) 
【 例 8-18】 利用 例 8 -2 中 的 数据 ， 用 Greenwood 近似 公式 估计 ,p 和 
gq; 的 方差 。 
解 : 对 于 例 8--2, r=30, s,=1, r,=29, s,=1。 


一 28、 1 1 56 
Te = (30) Er -29 “29 | -30 


若 使 用 经 验 估计 公式 (8. 2.17)， 则 有 


(2/30) (28/30) _56 
30 “30 





Yor[S (2)] = 


二 者 的 估计 结果 是 相同 的 。 
对 于 ,4 的 估计 ， 注 意 到 方差 的 计算 必须 在 给 定 第 二 年 初 有 28 人 的 情 
况 下 进行 。 从 此 刻 开 始 ， 只 有 一 次 死亡 事件 发 生 : 7, =28，s, =1。 因 此 ， 


一 ，、 28 27\” 1 27 
Var(,9 |,p =30) = (5) 28 .27 = 87 
注意 到 这 个 结果 和 例 8 -2 的 结果 是 一 致 的 。 旧 


从 本 例 可 以 看 出 ，Greenwood 公式 是 完整 个 体 数 据 的 方差 估计 的 推广 。 
事实 上 ， 在 完整 样本 的 情形 ，r, =7, 一 s,， 当 <t<yw 时 ， 


VarLS.)] = SND = SD 


EL i i ye! TiTirl 


pe 


r(n— 7r,) 


ey 








结果 和 例 8 - 10 完全 相同 。 

【 例 8 -19】 考虑 例 8 -5 的 数据 ， 重 新 估计 5,(2) 的 方差 ， 并且 构 造 
95% 的 置信 区 间 。 

解 : 从 例 8 - 16 的 结果 可 以 知道 : nr =m =29，s = =1。 由 例 8 -17 
知道 ，S (2) =0.9322。 代 人 Greenwood 公式 ， 有 


1 


六 区 二 
Var[ S,,(2)] = (0. 9322) pr i | =0. 002140 


运用 正 态 近似 ， 得 到 的 置信 区 间 端 点 为 : 0. 9322 + 上 1. 96 VY0.002140 ， 得 到 
的 区 间 为 (0. 841$S ，1. 0229 ) 。 里 

注意 到 ， 在 例 8 -19 中 ， 置 信 区 间 的 上 界 为 1.0229 大 于 1， 这 个 值 是 
没有 意义 的 。 在 小 样本 情形 下 ， 直接 运 用 正 态 近似 ， 极 有 可 能 得 到 这 样 的 
结果 。 解 决 这 个 问题 的 方法 是 使 用 对 数 转 换 的 置信 区 间 (1log-transformed 
confidence interval) 进行 估计 。 
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对 数 转换 的 基本 原理 如 下 : 令 Y,=g(X,)， 其 中 g〈(*) 是 连续 可 微 的 
函数 ， 蕊 是 对 E(X,) 的 一 致 估计 。 则 在 适当 的 正则 性 条 件 下 ， 
到 -EY)=g(X,.)-E(g(X,)) =g(X,) -gs(E(X.)) te(E(X,)) -El(g(X,)) 
=8'(X,.)(X,.— E(X,)) +o(X,—E(X,.)) 
因此 ,Var(Y,)~[g’(X,)] Var( X,)。 
1 


xln x 


我 们 取 了 = ln[ -In (5,(it) )] ， 相 应 地 g'(x) = 。 而 Kaplan - Meier 


Var[ S, (1) ] 
[S (insS(b] 





估计 s,( 是 S(t) 的 一 致 佑 计 。 因 此 ，Var(Y) = 由 此 


估计 2=ln[ -ln 5S(i)] 的 端点 为 : 
V Var[ S, (1) ] 
ln[ — ln S(t)] S90 Cyl oy 

对 应 的 Sb 的 置信 区 间 端 点 为 : 


exp{ -exp (In[ -ln S,(#)] 06 LS) } =S, | 1% i! | 


S, 《tn S, (站 Sn(t)in Sn(t) 





这 样 得 到 的 区 间 总 在 (0，1) 之 内 。 
【 例 8 -20】 用 对 数 转换 方法 重新 计算 例 8 -19。 
解 : 为 表示 方便 ， 我 们 记 
了 se A/ Var[ S, (1) _ = 人 96 - V0.002140 | ey 


S(t)In S.(t) 0. 9322 .ln 0. 9322 


所 以 置信 区 闻 为 (S, (1)”，, S,(t)") = (0.9322*”Y ，0. 9322?5 ) = (0.7554， 
0. 9826) 。 





8.3.3 危险 率 函 数 的 Nelson-Aalen 估计 

前 文 介绍 的 经 验 模 型 是 离散 分 布 模型 ， 根 据 这 个 离散 模型 无 法 求 导 获 
得 密度 函数 和 危险 率 函 数 。 下 面 介 绍 修正 的 Nelson-Aalen 方法 来 估计 累积 
危险 率 函 数 H(i)。 在 第 二 章 中 ， 我们 已 经 知道 H(i1)、h(1) 和 S(t) 满足 








如 下 关系 式 : 
H(z1) = -ln S(i) (8.3.13) 
Sb _f) 
WC (8. 3. 14) 


下 面 给 出 及 (i) 估计 的 直观 推导 。 在 任意 时 刻 ;, 令 r(i) 是 风险 集 ， 
h(t) 是 危险 率 孙 数 ，s(t) 表示 在 时 刻 i 之 前 身 故 的 个 体 数 目的 期 望 值 ， 则 
可 以 得 出 以 下 结论 : 


Sy {rR u) du 
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.ht Si DR i ne he ,dd ld, i hs fa Rit i eh cag em a tt -> 
两 边 求 导 ， 有 ds(t) =r(t)h(1) dt。 于 是 ， 人 =h(t) di。 两 边 积分 ， 得: 





| 和 = fra = H(i) 


现在 将 真实 的 期 望 值 s:(:) 用 i 时 刻 之 前 的 身 故 个 数 的 观测 值 s(1) 代 兰 。 
s(i) 是 一 个 阶梯 函数 ， 在 每 一 个 身 故 发 生 的 时 刻 增加 ;;,， 因 此 上 式 的 左边 


为 之 这 就 给 出 了 H(t) 的 Nelson-Aalen 估计 值 : 
0 ， x% < yi 
S Sy <x< 
B(x) = Sy = by 六 ， yi- 守 % ys (8.3.15) 
yx 了 
二 之 和 


相应 地 ， 由 式 (8. 3. 13) 生存 函数 的 Nelson-Aalen 估计 值 为 : 
RS 
为 了 计算 Nelson-Aalen 估计 的 方差 ， 我 们 假设 在 身 故 时 刻 y 附近 的 个 
体 数 服从 参数 7h(y) 的 泊 松 分 布 。 因 此 ，Var(s) =nh(5) 可 以 用 7, 汪 =5 来 
估计 。 假 设 各 时 间 点 死亡 人 数 相互 独立 ， 于 是 可 近似 地 有 


-一 





a 二 Pe i 了 了 V i 

Var[ B(y,)] = Var( > 加 = = > 蕊 (8.3.16) 
对 一 般 的 时 间 上 ， 我 们 有 : 

Var[ BC)] = Var| 了 过] ge (8.3. 17) 


Yayist 


由 此 ， 得 到 H(i) 的 线性 置信 区 间 为 : 





Kor? 
H(t)exp1 土 





注意 ， 这 里 我 们 没有 假定 数据 的 非 完 整 性 。 无 论 对 于 完整 数据 还 是 非 完整 
数据 ，Nelson-Aalen 估计 都 是 相同 的 。 

【 例 8 -21】 利用 例 8 -7 的 数据 ,计算 累积 死亡 力 蚂 数 的 Nelson- 
Aalen 估计 ， 与 例 8 -9 的 结果 作 比 较 。 

解 : 由 (8.3.15) 计算 得 : 
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1 
一 =0. 125 
8 9 


0. 125 + 地 =0. 4107 ， 


0. 4107 + 二 =0. 8107 ， 


0. 8107 + 于 =1. 1440 ， 


1. 1440 + 并 =1 6440 ， 


1. 6440 + 二 =2. 0440 ， 


人 





x<l 


1<x<2 


2<x<4 


4<x<6 


6<x<7 


7<x <9 


x 宇 9 


利用 Nelson-Aalen 估计 得 到 的 分 布 函 数 的 估计 六 (xz) =1 -e“* 中 与 经 验 


分 布施 数 F,(x) 是 不 同 的 ， 可 在 图 8 -5 中 看 出 。 甘 
分 布 函 数 的 估计 
累 
积 
分 


0.6 
0.4 


0.2 





6 8 10 观测 值 


图 8-S 经 验 分 布 活 数 与 Nelson-Aalen 估计 的 比较 


【 例 8 -22】 对 例 8 -5 中 的 数据 ,估计 五 (2)95% 的 近似 置信 区 间 。 


解 : 由 例 8 -16 的 结果 ， 有 (2) =1/29 +1/29 =0. 06897， 方 差 估 计 值 为 1729? 


+1/29” =0. 002378 。 线 性 置信 区 闻 的 端点 是 : 0.06897 +1.96 V0.002378 = 
0. 06897 + 上 0. 09558 ， 得 到 的 区 间 是 : (- 0.02661，0. 1645) 。 注 意 到 区 间 包 括 


了 负 值 。 采 用 对 数 转 换 的 方法 ， 令 
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1. 96/0. 002378 | a 


exp| 0. 06897 





从 而 置信 区 间 的 端点 为 0.06897U*， 得 到 的 区 间 是 (0. 01725 ，0. 27576 ) 。 
加 


$8.4 核 密度 估计 


经 验 分 布 估计 作为 对 完整 数据 分 布 末 数 的 估计 ， 具 有 无 偏 性 和 一 致 性 
的 良好 性 质 。 但 是 经 验 分 布 是 一 种 离散 分 布 ， 在 每 个 观测 点 有 点 概率 ， 其 
余 点 的 概率 为 0。 如 果 已 知 真实 的 分 布 是 连续 的 ， 则 经 验 分 布 的 近似 程度 边 
差 。 核 密度 估计 方法 (kernel density estimation ) 用 一 种 连续 的 分 布 函数 来 
近似 离散 的 经 验 分布 函 数 ， 从 而 为 分 布 密 度 的 估计 提供 了 一 种 手段 。 


8.4.1 核 函数 与 核 密度 估计 
我 们 沿用 8. 2. 1 中 的 记号 。 假 设 完 整 的 数据 集 为 {x,，x;,，…，x,},， 其 
中 包括 不 同 的 数值 为 y, <y, <… <y,， 并 且 记 s, =#|x,:x,=y,| 表示 取 值 x, 的 


5 


观测 值 的 个 数 ， 则 观测 值 y 的 经 验 密 度 是 p(y,) = 了 由 8.2 中 的 结论 知 
道 ， 经 验 分 布 函 数 的 估计 为 : 
F(xz) = 闻 二 (xi<x) = 5 p(y,) 


i=1 Fy 


核 密度 估计 法 使 用 连续 随机 变量 来 替代 每 个 离散 的 点 ， 使 用 核 旺 数 
k(* ) 进行 核 密度 估计 的 估计 量 是 : 


1 lv-x 1 
J | > ] = AC (8.4.1) 





其 中 是 带宽 bandwidth) ,hh(") = 天 寻 元] 是 尺度 变换 后 的 核 画 数 。 
如 果 用 y <y, <… < 入 来 表示 ， 式 (8.4.1) 也 可 写 做 : 
PA) = PpODBy -4) = 三 有 -aa (8.4.2) 
显然 两 种 表示 方法 是 等 价 的 。 


使 得 f,(x) 成 为 密度 函数 的 充 要 条 件 是 用 于 加 权 的 核 函 数 h(*) 是 一 
个 密度 函数 。 这 是 因为 : 


1 = | ACs)ax = 「 af ny —x)dF,.(y) = [ar hly — x)dx 


= [arf hd -= [ arf hd = | hl du 
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习惯 上 要 求 密度 函数 为 核 函 数 的 随机 变量 的 均值 等 于 所 替代 的 数据 点 ， 
但 这 并 不 是 必须 的 ， 而 仅仅 是 为 了 让 核 估 计 与 经 验 估计 有 相同 的 均值 。 

进行 核 密 度 估 计时 ， 核 函数 的 形式 k(* ) 和 带宽 h 都 是 事先 给 定 的 。 为 
了 研究 的 方便 ， 我 们 假设 上 (: ) 仅 在 闭 区 间 [ -1, 1] 上 取 非 零 值 (具有 紧 
支 集 ) ， 而 尺度 参数 hh 使得,(:) 的 形状 可 以 拓展 到 一 般 的 形式 。 男 一 方面 ， 
把 hh 明确 地 写成 一 个 核 淆 数 的 参数 ， 可 以 独立 地 分 析 带 宽 对 估计 方差 和 偏 
误 的 影响 。 

由 密度 函数 的 核 密度 估计 ， 可 以 得 到 分 布 函数 的 核 密 度 估 计 。 当 大 (…) 
是 对 称 分 布 时 ， 


Boo)= | 户 (Dd = 人 ds bly -a)aF,(y)= | dry)| hly -2) dz 
[Ks -I dF.(y) = D p(y) Kx —Y) (8. 4. 3) 


其 中 ，K,(.) 是 密度 函数 (+) 对 应 的 分 布 函 数 : K(x)= (wu)du。 


如 果 令 K(x) = | k(w)du， 则 易 知 K(x) =K( 革 )。 


8.4.2 常见 的 核 函 数 

从 式 (8.4.2) 可 以 知道 ,任意 的 密度 函数 都 可 以 作为 核 函数 进行 核 密 
度 估计。 常见 的 核 函 数 有 以 下 三 种 : 

1. 均匀 核 函 数 。 如 果 我 们 取 [ -1，1] 上 均匀 分 布 的 密度 函数 作为 核 


函数 ， 则 有 
kl(u) = 


,1l<u<1l 


EE 
2 

加 入 带宽 作为 斥 度 参数 后 ， 一 般 的 均匀 核 函 数 为 : 
1 





ki (LL) = —-h<u<h (8.4.4) 
它 对 应 了 [ -hh,，h] 上 的 均 勾 分布 。 相 应 地 ， 
0 ， 2 < 一 天 
区 C2 tt, _h<u<h (8. 4. 5) 
ds uw>h 


基于 均匀 核 孙 数 的 密度 函数 的 核 密 度 和 人知 计 为 : 
f(x) 三 Fpl ~h<x<x,+h)-= Bp) BI hes<y +h) 
(8.4.6) 


分 布 函 数 的 核 密 度 估计 为 : 
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你 x—y,+h 
B(x) = 5 py) TET 5 py) (8.4.7) 


j:z-hyr+h 2h td ok 


在 均匀 核 函 数 下 ， 密 度 函 数 的 估计 就 是 对 每 一 点 带宽 范围 内 的 经 验 密 
度 的 平均 值 ， 它 和 直方 图 既 有 联系 又 有 区 别 。 把 密度 画 数 的 估计 可 以 写成 : 


1 
f(x) = pt i:% -hs<xr,<rx+hl} 


而 直方 图 的 计算 公式 可 以 写 做 : 


{xi:c x, <c,! 





5 cE%<oe 


(x) = 
0 


容易 看 出 ， 二 者 本 质 都 是 对 一 定 范围 内 的 经 验 密度 求 取 平均 ， 估 计 的 密 
度 隐 数 都 是 分 段 常 值 的 函数 。 两 种 方法 的 区 别 是 ， 在 直方 图 中 每 个 分 段 区 间 
[c,.,，<;) 是 事先 给 定 的 ， 与 x 无关 ， 而 在 核 密度 估计 中 分 段 区 间 [x ~h， 
%#% + 天] 是 由 >* 决定 的 。 

【 例 8 一 23】 某 个 损失 数据 的 样本 为 : 7，12，15，19，26，27，29 ， 


29，30，33，38，53 。 给 定 带 宽 参 数 记 =5， 利 用 均匀 核 函 数 ， 估 计 广 (20) ， 


F(20), f(30), F(30)。 

解 : 我 们 借助 图 8 -6 说 明 核 密度 估计 的 原理 。 左 图 是 密度 函数 的 估 
计 ， 右 图 是 分 布 函 数 的 估计 ， 虚 线 划 分 的 范围 表示 估计 点 20 和 30 所 对 应 
的 带宽 。 对 于 密度 估计 ， 只 需要 将 带宽 范围 内 的 点 利用 对 应 的 核 函 数 加 权 
平均 ， 对 于 分 布 函数 估计 ， 除 了 带宽 范围 内 的 点 加 权 以 外 ， 还 要 对 左 侧 所 
有 点 赋予 1 的 权重 。 


fi (x) 





图 8 -6 均匀 核 密度 估计 示意 图 
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对 于 f(20) ， 需 要 考虑 15，19 处 的 经 验 密度 ， 两 点 的 权重 都 为 六 = 1。 


利用 式 (8. 4.6) 得 到 : 
Ee so 
12 10 12 10 60 
对 于 (20) ， 需 要 考虑 的 点 包括 7、12、15、19。 其 中 前 两 个 点 在 带宽 
范围 左边 ， 权 重 为 1， 利用 式 (8.4.7) ， 第 三 个 点 权重 也 为 1， 第 四 个 点 权 











重 为 0.6。 因 此 : 
(20) = 方 1+ 方 1+ 方 1+ 方 0.6 = 二 
同 法 可 得 : 
De 
PK30) = 方 "1+ 证 "1+ 二 "1+ 证 "1+ 证 "0.9+ 二 “0.8 
+ 方 0.6+ 让 "0.5+ 方 0.2 = 


我 们 可 以 绘制 核 密度 估计 的 分 布 函 数 和 密度 函数 图 像 ， 如 图 8 -7 
所 示 。 


密度 随 数 分 布 昂 数 
0.05 1.0 
0.04 0.8 
0.03 0.6 
0.02 0.4 
0.01 0.2 
0.00 0.0 
10 20 30 40 50 x 10 20 30 40 50 x 


图 8 -7 均匀 核 密度 估计 的 密度 条 数 和 分 布 函数 


男 
2. 三 角 核 函数 。 如 果 我 们 取 [ -1，1] 上 三 角形 的 函数 作为 核 函 数 ， 
则 有 


kl(u)=1-tx|l, -li<x<l 
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人 -PE 
0 L< 一 工 
e+) 3 -1<u<0 
K(u) = ， 
1 -2 0O<u<l 
1 ， u 宇 1 
加 入 带宽 作为 尺度 参数 后 ， 一般 的 三 角 核 隔 数 为 : 
hw) = _h<u<h (8. 4. 8) 
它 对 应 了 [ -hh, h] 上 的 三 角形 分 布 。 相 应 地 ， 
0 ， wu<—h 
Ce, _h<u<0 
K,(u) = (和 = (8.4.9) 
a : O<u<h 
2h 
es u 宇 h 


【 例 8 -24】 重新 计算 例 8 -23， 利 用 三 角 核 函数 估计 ， 带 宽 不 变 。 
解 : 这 里 也 给 出 相应 的 估计 示意 图 ， 见 图 8 -8。 


f(x) f(x) 
0.15 0.15 


0.10 0.10 


| E : 
-0 25 0025 5050 -和 0025 50 


0.05 


0.00 二 上- 
10 20 30 40 50 x 





图 8 -8 三 角 核 密度 估计 示意 图 


估计 过 程 类 似 8 - 23。 为 计算 1(20)， 需 要 考虑 的 点 是 15，19。 由 式 


(8.4. 8) 0 言 。 因 此 : 
4 1 
f(20) = 坪 ”25 一 75 
对 于 对 于 有 (20) ， 由 式 (8. 4.9) 计算 得 到 点 7、 15、19 的 权重 分 别 为 
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(19 -20 +5)” 17 








和 人 全 二 = 二 -。 > 
2 .5 25 因此 
1 1 1 17 23 
F(2 和 一 。1 。 。 一 
(20)=12°11+12"1+12 .1+12°25 -75 


同 理 可 得 , f(30) =3/50, F(30) =49/75。 相 应 的 估计 结果 示意 图 如 
图 8 -9 所 示 。 


密度 函数 分 布 函 数 

1.0 

0.06 

Ds 0.8 

0.04 0.6 

0.03 
0.4 

0.02 

0.01 

0.00 0.0 

10 20 30 40 50 > 10 20 30 40 50 x 


图 8 -9 三 角 核 密度 估计 的 密度 函数 和 分 布 函数 


3. 人 徊 玛 核 函 数 。 前 文 介绍 的 核 函 数 是 一 般 的 情形 ， 在 给 定 带 宽 的 情况 
下 ， 权 重 仅 和 观测 值 与 待 估 计 点 x 的 距离 有 关 。 何 玛 核 函数 是 一 种 特殊 的 
核 函 数 ， 它 的 权重 不 是 按照 样本 点 与 待 估 计 点 的 距离 来 定义 的 。 对 于 每 一 
个 观测 值 x;， 我 们 用 一 个 均值 为 x, 的 伽 玛 分 布 耻 (ww，xi/a) 来 代表 ， 其 密 
度 卫 数 为 : 


Tt 
na) Ta We 


任意 待 估计 点 x we 以 通过 这 样 一 A 


-1 -za/x, x 1e -xa/y, 


e 


Os % (y/o ) -Ta) 

容易 知道 ， 在 这 个 核 密度 估计 中 ， 参 数 a 是 尺度 参数 ，a 越 大 对 应 的 
估计 越 平滑 。 而 最 终 估计 的 函数 是 一 个 混合 的 伽 玛 分 布 。 

【 例 8 -25】 重新 计算 例 8 -23 中 的 两 个 密度 估计 ， 利 用 伽 玛 核 函 数 ， 
a 取 5 或 50。 

解 : 伽 玛 核 函数 估计 中 ， 对 任意 的 待 求 点 ， 所 有 的 观测 值 都 将 赋予 权 


重 。 因 此 计算 量 相对 较 大 ,此 处 省 略 中 间 步 又 。 当 a =5 时 , f (20) = 
0.3200, f(30) =0.2366; 当 aw =50 时, f(20) =0.2111, f(30) =0. 5029 。 


f(x) = (8.4.11) 
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图 8-10 不 同 尺 度 参 数 下 伽 玛 核 密 度 估 计 
图 8 -10 列 出 了 两 种 尺度 参数 下 的 估计 结果 。 从 图 中 可 以 看 出 ， 在 不 
同 尺度 参数 下 ， 估 计 的 形态 是 显著 不 同 的 。 向 
8.4.3 带宽 对 信 计 的 影响 
从 例 8 -25 中 ,我 们 已 经 看 到 尺度 参数 对 估计 的 影响 。 在 一 般 核 函数 


估计 中 ， 实 践 中 证 明 核 渔 数 的 选取 对 估计 的 偏 误 影响 不 大 ， 而 带宽 h 的 变 
化 却 会 使 估计 结果 产生 很 大 的 波动 。 


AD 均匀 核 应 数 fc) 三 角 核 函数 








图 8-1 不 同 带宽 选取 对 密度 估计 结果 的 影响 


图 8 -11 绘制 了 分 别 取 带宽 hh=5，h =20 对 例 8 -23 的 数据 进行 估计 
的 结果 。 可 以 看 出 ,大 的 带宽 可 以 得 到 更 加 光滑 的 结果 ， 而 小 的 带宽 能 够 
反映 出 局 部 的 密度 变化 。 对 于 相同 的 带宽 ， 采 用 不 同 核 函 数 估计 的 结果 相 


差 并 不 大 。 理 论 上 ， 带 宽 造成 的 渐进 偏差 为 0( 忆 ) ， 而 渐进 方差 为 0 ， 
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因此 使 估计 偏 误 最 小 的 带宽 为 0(n 5)， 所 以 样本 量 增 大 ， 相 应 应 该 选取 
较 小 的 带宽 。 实 际 应 用 中 ， 需 要 根据 一 定 的 规则 进行 选取 。 


$8.5 大 样本 数据 下 的 经 验 分 布 函 数 估计 


当 数据 量 很 大 的 时 候 ， 如 果 使 用 Kaplan - Meier 估计 方法 ， 必 须 进行 大 
量 的 数据 排序 和 计算 工作 ,但 是 从 结果 看 ， 如 此 繁杂 的 工作 是 不 必要 的 。 
比如 在 生命 表 的 估计 中 ， 我 们 只 需要 计算 整数 年 龄 的 函数 值 ， 而 不 需要 知 
道 每 个 观测 值 的 生存 函数 。 因 此 ， 可 以 采用 近似 的 方法 进行 估计 。 


8.5.1 Kaplan ~- Meier 近似 

给 定 区 闻 的 端点 co <cl<:…<c， 令 站 =#ld:c sd<cli 是 区 间 
[c- ，c) 中 茶 个 点 的 左 截断 的 观测 值 个 数 ，U, =#{w:c.! <wi 志 cj| 表示 区 
间 〈c-,，c] 上 某 个 点 右 删 失 的 观测 值 的 个 数 。 注 意 这 里 区 间 的 处 理 是 不 
同 的 ， 这 是 因为 : 如 果 截 断 发 生 在 c， 或 者 删 失 发 生 在 c,,， 则 对 于 这 个 个 
体 我 们 对 它 在 区 间 (c-,，c) 上 的 生存 状况 一 无 所 知 ， 因 此 对 相应 的 画 数 
估计 没有 影响 。 相 应 地 ， 我 们 记 (c.,， cj]」 中 未 删 失 的 观测 值 数目 为 X,。 


此 时 ， 样 本 总 量 为 n= 袜 D = 允 (%+ 0)。 

风险 集 的 计算 理论 上 应 该 使 用 式 (8. 3.2) ， 但 是 这 里 我 们 要 求 的 是 一 
个 时 间 眉 上 的 风险 集 的 大 小 。 近 似 计算 的 思想 是 引入 一 个 假定 的 值 ”< 
(6c,，<)) ， 并 且 假 设 所 有 未 删 失事 件 都 发 生 在 ce; 处。 这 样 ， 我 们 就 可 以 用 
oc 处 的 风险 集 来 近似 (c,.,，c,) 上 的 风险 集 。 则 式 (8. 3.2) 可 以 化 为 : 


r, =#|{d,:d, <c) | ~#{x,:x <ci | ~#{u:u,<e,} 
= [#1{d,:d, <c,., } —#{x,:x < ci- 1) —#{w,: :2 <c.i}] 
+#{d,: :Cd < cy } —#{u.,: :C1 Su, <e; } 
=P,+#|d,:c <d < | ~-#Ivu:c <u <oe} (8.5.1) 
Ji 
其 中 ，P, = 》， (D,— X,— UU.) (8.5.2) 
i=l 


注意 到 式 (8. 5.1) 中 ， 在 c- 时刻 风险 集 的 大 小 已 是 可 以 计算 的 ， 而 
其 他 三 项 需要 基于 一 定 的 假设 进行 调整 。 一 般 情 况 下 ， 我 们 假设 在 [c-,， 
co) 上 截断 的 个 体 数 占 [cj.,，c;) 上 截断 个 体 数 也 的 比例 是 100c% ， 在 
[c,，c ) 上 删 失 的 个 体 数 占 (c，c] 上 删 失 个 体 数 U 的 比例 是 
1008% 。 这 样 ， 就 有 : 

#{d.:c, <d,.<c;} =D,-: 100a% 
#{u,:c 1 <u <c | =U,* 1008% 
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代入 式 〈8.5.1) ， 即 得 到 : 
r= P,+aD,-BU, (8.5.3) 
Kaplan - Meier 估计 中 ， 每 一 项 条 件 概 率 
A X， 
P(X>c,|X>c,..)=1 ee 
因此 ， 生 存 函 数 的 估计 为 : 
S(c)= I P(X>e|X>6,) = (1 -3 (8. 5.4) 


常见 的 一 种 选择 是 a =1，B =0， 表 示 假 设 所 有 的 左 截 断 发 生 在 ”以 
前 、 同 时 所 有 的 删 失 发 生 在 o 以 后 。 此 时 ,n= 也 D, 一 台 (X。+U)。 伟 
统 的 生命 表 估 计 就 是 这 种 情形 ， 此 时 分 组 c。<c, <… <c 取 一 组 整数 值 。 死 
亡 率 的 估计 公式 是 : 
sR (8.5.5) 
S(c,.1) i 

在 此 公式 中 ， 所 有 当前 时 段 或 者 更 早 时 候 进 入 研究 项 目的 个 体 都 被 视 
做 可 能 身 故 的 个 体 ， 而 所 有 当前 时 段 前 就 离开 的 个 体 不 考虑 在 内 。 

另 一 种 选择 是 令 a =B6 =0.5， 这 相当 于 假设 进入 和 退出 研究 项 目的 事 
件 在 区 间 内 均匀 分 布 ， 而 所 有 风险 事件 发 生 在 区 间 的 中 点 。 由 于 已 ,= 已 + 
D, ~- U, - 色 ,因此 式 (8. 5.3) 也 可 写 做 : 

r;=0.5(P,+P,,, +X,) (8.5.6) 





r 
qi; 全 ,9 


8. 5.2 多 元 衰减 表 

在 第 二 章 中 ， 我 们 考虑 多 因素 死亡 模型 ， 分 别 计算 各 个 因素 造成 的 死 
亡 概率 。 这 个 概念 可 以 推广 到 非 寿 险 模 型 中 ， 在 一 次 研究 项 目 中 ， 可 以 同 
时 考虑 多 个 因素 同时 造成 的 观测 值 数 目的 衰减 ， 计 算 多 元 终止 概率 (multi- 
ple - decrement probability ) 。 我 们 用 g/” 表 示 单 个 因素 i 引起 的 终止 概率 。 
例如 ， 在 生命 表 估 计 中 ， 豪 减 可 以 由 身上 故 4d、 退 保 w 和 退休 7 造成 的 ， 则 可 
以 用 g'” 表示 在 身 故 和 退休 都 没有 发 生 的 前 提 下 ， 年 龄 为 c 的 个 体 在 cj, 
前 退 保 的 概率 ， 而 gq;'” 表示 在 身 故 和 退休 可 能 发 生 的 情况 下 相应 的 退 保 
概率 。 

在 第 二 章 中 ， 我们 已 经 讨论 了 在 不 同 假设 下 ，g;'"” 和 gq 的 相互 推算 关 
系 。 此 处 我 们 仅 考 虑 在 均匀 分 布 假 设 下 终止 概率 的 估计 ， 这 时 ， 


Qi (8.5.7) 


其 中 9 =1- TI (1 -gq/”) 表 示 总 终止 概率 。 
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【 例 8 -26】 运用 例 8 -5 中 的 数据 ， 以 整数 年 份 划分 区 间 ， 根 据 死亡 
时 间 均 勾 分 布 假设 ,估计 相应 的 单个 衰减 因子 和 多 元 衰减 相关 量 。 

解 : 注意 对 端点 的 处 理 。 在 0 处 截断 的 数据 实际 上 是 没有 截断 的 ， 因 此 
Du =30， 而 D, =1。 根 据 死 亡 时 间 均 匀 分 布 的 假设 ,就 可 以 得 到 7, = P, +0.5 
(D, -UV,) =29.5。 其 他 区 间 计 算 利用 式 (8.5.2)、(8.5.5) 和 (8.5.6) 计 
算 。 结 果 如 表 8 -9 所 示 。 


表 8 -9 例 8 -26 的 Kaplan - Meier 近似 计算 法 估计 生存 函数 


YO =X/5) 



























0 30 0 0 2 = 0. 0000 1.0000 
1 1 2 1 30 29. 5 0.0339 0.9661 
2 1 1 1 28 28.0 0.0357 0.9316 
3 1 0 1 27 27.5 0.0364 0. 8977 
4 1 2 0 27 26.5 0. 0000 0. 8977 





26 25.5 0. 0000 0. 8977 








.0400 





























对 于 退 保 的 情形 ， 可 以 依据 式 (8. 5.7) 进行 计算 ， 如 表 8 -10 所 示 。 





















































表 8 -10 例 8 -26 的 多 元 衰减 估计 

ci U, 雍 7 gt 人 《 去 DA ) qd 各 df 

0 0 0 三 0. 0000 0. 0000 0. 0000 pe = 

1 2 1 29.5 0. 0339 0.0678 0.0994 0.0327 0.0667 

2 1 1 28.0 0.0357 0.0357 0.0702 0.0351 0.0351 

3 0 1 27.5 0. 0364 0. 0000 0.0364 0.0364 0. 0000 
NE 

4 2 0 26.5 0. 0000 0.0755 0.0755 0. 0000 0. 0755 

5 2 0 23:5. 0. 0000 0.0784 0.0784 0. 0000 0.0784 

| 

6 1 1 25.0 0.0400 0.0400 0.0784 0.0392 0.0392 
| 

4 2 2 24.0 0. 0833 0. 0833 0.1597 0.0799 0.0799 

8 2 2 22.0 0. 0909 0. 0909 0. 1736 0. 0868 0. 0868 

9 1 点 19. 5 0. 1026 0. 0513 0. 1486 0. 1000 0. 0486 

10 17 0 8.5 0. 0000 0. 0000 0. 0000 = 一 
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习 题 


1. 来 自 10 份 保单 的 赔付 额 数据 如 下 : 2、3、3、5、5+、6、7、7+、 
以 下 同 ) 。 使 用 乘积 极限 估计 ， 计 


9、11+ (+ 表示 损失 额 超过 保单 限额 ， 


算 保 单 损失 超过 6.5 的 概率 。 
2. 给 定 含有 删 失 和 截断 的 生存 数据 如 表 8 一 11 所 示 。 
设 在 时 刻 工 后 仍 未 出 险 的 人 在 时 刻 S 或 之 前 出 险 的 概率 是 ;9g,， 用 


Greenwood 近似 公式 估计 ;人 的 方差 。 


3. 给 定 含 有 删 失 和 截断 的 生存 数据 如 表 8 一 12 所 示 。 
















































表 8 -11 表 8 -12 
时 间 (1) | :时 刻 的 风险 数 | :时刻 出 险 数 s; 时 间 (1) | 上 :时刻 的 风险 数 关 | 4 时 刻 出 险 数 s，; 
1 30 5 1 30 5 
2 27 9 2 27 9 
kK 32 6 二 32 6 
25 4 25 10 
5 27 7 














使 用 Nelson-Aalen 估计 来 计算 有 H(3) 的 90% 置信 水 平 的 对 数 变 搁置 信 


区 间 。 


4. 在 两 个 国家 的 保险 产品 的 死亡 率 研 究 中 ， 给 定数 据 如 表 8 -13 所 示 。 














表 8-13 
A 国 B 
六 5) ni 5S) 万 
1 20 200 15 100 
2 54 180 20 85 
3 14 126 20 65 
4 22 112 10 45 
5 15 110 10 40 
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其 中 rr 是 (t,t ) 期 间 的 风险 数 ，5S, 是 (t,t) 期 间 的 死亡 数 ， 并 假 
定 全 部 在 天时 刻 发 生 。 令 SS (ti 表示 基于 两 国 汇 总 数据 的 S(t1) 的 乘积 极 
限 估计 ，S (zi) 是 仅 基 于 B 国 数据 的 S(r) 的 乘积 极限 估计 。 求 
|1S7(5) -SC5) | 。 

5. 累积 危险 率 甩 (t。) 的 95% 置信 水 平 的 线性 置信 区 间 是 (1.63， 
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1.99) ， 求 其 90 史 置信 水 平 的 对 数 变换 置信 区 间 。 
6. 一 份 保 单 组 合 产 生 了 如 下 赔付 : 100、150、196、250、300、300、 
400 、450、590、770。 求 票 积 危险 率 有 H(300) 的 经 验 估 计 。 


7. 对 一 份 保单 组 合 有 如 下 信息 ， 求 S1(1 250) 与 $,(1250) 之 间 差 的 绝 
对 值 : 
(1) 各 保单 都 没有 免 赔 额 ， 且 保单 限额 各 不 相同 ; 
. (2) 一 个 有 10 个 赔付 额 的 样本 如 下 : 350、350、500、500、500 +、 
1000、1000 +、1000 + 、1200、1500 ; 


(3) $S (1250) 是 S(1 250) 的 乘积 极限 估计 j 


(4) 假设 损失 额 服从 指数 分 布 ，8(1250) 是 对 S(1250) 的 最 大 似 然 
估计 。 
8. 来自 10 份 保 单 的 赔付 额 数 据 如 下 : 4、4、5+、6+、7+、8、10 +、 


10 + 、13、15。 用 Greenwood 近似 公式 估计 乘积 极限 估计 S(12) 的 方差。 

9, 对 生存 研究 中 的 第 i 个 观测 ， 记 d, 是 左 截 断 点 ，x, 是 没有 右 删 失 时 
的 观测 值 ，u, 是 右 删 失 时 的 观测 值 。 绘 定 表 8 一 14,， 利 用 以 上 数据 求 
Sio(1.6) 的 乘积 极限 估计 。 


























表 8 -14 
本 | > 
观测 (让) di Xi wi 观测 〈 巧 d; Yi Wi 
1 0 0.9 一 6 0 1.7 
SR 
2 0 一 :2 7 0 一 ls7 
3 
3 0 1.5 一 8 1.3 2.1 -一 
4 0 一 1.5 9 1.5 2.1 一 
5 0 一 1.6 10 1.6 一 23 


























10. 某 个 死亡 率 研 究 中 包含 于 个 人 人。 假设 没有 删 失 数据 ， 死亡 不 会 同时 
发 生 。 已 知 累 计 危 险 率 入 (t,) 的 Nelson-Aalen 估计 是 59/870。 令 已 是 第 天 
次 死亡 发 生 的 时 间 ， 用 了 乘积 极限 估计 求 时 的 生存 函数 值 。 

11. 车 用 S(t) 的 乘积 极限 估计 S(t) 来 求 其 置信 区 间 ， 已 知 S(t) 的 
97. 5% 置信 水 平 的 对 数 变 换 置信 区 间 是 (0.695，0.777)， 求 $(4,)。 

12. 在 研究 保单 退 保 的 研究 中 ， 给 定 下 面 100 份 保单 的 信息 ， 求 n: 

(1) 每 当 有 一 份 保单 授 保 ， 就 会 有 一 份 新 保单 加 进来 ， 即 风险 集 7 恒 
等 于 100; 

(2) 退 保 只 发 生 在 保单 年 末 ， 其 中 每 个 保单 年 末 的 退 保 数 如 下 : 第 1 
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年 末 1 份 ， 第 2 年 末 2 份 ,第 3 年 末 3 份 … 第 性 年 末 叶 份 ; 


(3) 时 刻 灵 时 的 累积 分 布 函 数 的 Nelson-Aalen 售 计 为 FP(n) =0. 5975。 

13. 在 索赔 赔付 次 数 的 研究 中 ， 假 定数 据 没 有 删 失 或 截断 ， 一 次 索赔 
至 多 支付 一 次 。 已 知 第 二 次 赔付 后 的 肯 间 ， 累 积 危 险 率 的 Nelson-Aalen 估 
计 是 17/72。 求 第 四 次 赔付 后 的 瞬间 ， 累 积 危 险 率 的 Nelson-Aalen 估计 。 

14. 已 知 (0.357，0.521) 是 上 上 时刻 Nelson-Aalen 估计 的 累积 危险 率 的 
90% 置信 水 平 的 对 数 变 搁置 信 区 间 ， 求 S(t) 的 Nelson-Aalen 估计 。 

15. 一 个 损失 样本 中 包含 以 下 15 个 损失 数据 : 11、22、22、22、36、 


51、69、69、69、92、92、120、161、161、230。 设 启 (xz) 是 累积 危险 率 
的 Nelson-Aalen 经 验 估计 ， 应 (zx) 是 假设 样本 来 自 损失 服从 指数 分 布 的 总 体 


时 ， 累 积 危 险 率 的 最 大 似 然 估计 。 求 | 应 (75) -应 (75) | 。 

16. 12 位 投保 人 自 保单 生效 伊始 就 开始 接受 观察 ， 直 到 发 生 第 一 次 索 
赔 ， 如 表 8 -15 所 示 。 使 用 Nelson-Aalen 估计 计算 累积 危险 率 肪 (4.7) 的 
90% 置信 水 平 的 线性 置信 区 间 。 


表 8 -15 






首次 索赔 发 生 时 间 


17. 在 一 项 生存 研究 中 ,死亡 发 生 时 间 依 次 为 y <y,<… <Yo 已 知 和 6 


和 y, 时 刻 的 累计 危险 率 的 Nelson-Aalen 估计 分 别 为 (ys) =0. 4128 和 应 (7 ) = 


0. 5691， 其 估计 量 方 差分 别 Var( 且 (yy,)) =0.009565 和 Var(H(y,)) = 
0.014448， 求 y) 时 的 死亡 数 。 
18. 已 知 数据 集 {fy} 为 : 200、300、100、400、 瑟 。 给 定 (1) k=4; 


(2) s =1; (3) r, =1; (4) Nelson-Aalen 估计 及 (410) >2.15。 求 五 的 值 。 
19. 已 知 数据 集 {y,} 为 : 2500、2500、2500、3617、3662、4517、5000、 


5000、6010、6932、7500、7500。 设 诺 (7000) 是 数据 集 1y} 中 没有 删 失 数据 时 
的 Nelson-Aalen 估计 。 左 (7000) 是 数据 集 {y,] 中 仅 2500，5000，7500 这 7 个 


数 是 右 删 失 时 的 Nelson-Aalen 估计 。 计 算 | 到 (7000) - 半 (7000) | 。 

20. 一 个 研究 右 截 断 数 据 的 死亡 率 研究 中 ， 给 定 以 下 数据 《 见 表 8 -16)。 
已 知 时 刻 为 10 时 生存 函数 的 Nelson-Aalen 估计 是 0.6133， 求 天 的 值 。 

21. 有 5 位 患者 从 发 病 到 死亡 的 时 间 的 数据 如 下 : 2、3、3、7、8， 用 
带宽 为 1 的 三 角 核 函数 估计 时 间 为 2.5 时 的 密度 函数 。 
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< 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


22. 设 菜 总 体 的 分 布 肖 数 是 F(x)， 给 定 下 列 样本 数据 : 2.0、3.3、 
3.3、4.0、4.0、4.7、4.7、4.7, 使 用 带宽 为 1.4 的 均匀 核 函 数 计算 下 (4) 
的 核 密度 估计 。 

23. 来 自 某 一 总 体 的 10 个 样本 数据 为 : 1|、2、3、3、3、3、3、3、3、 
3。 分 别 记忆 (xz) 是 使 用 带宽 为 1 的 均匀 核 函 数 的 核 密 度 估 计 ， 配 (xz) 是 使 
用 带宽 为 1 的 三 角 核 函数 的 核 密度 估计 。 求 在 [0, 4] 内 满足 天 (xz) = 
把 (x) 的 区 间 。 

24. 下 面 是 10 个 观察 者 的 死亡 年 龄 : 38、40、46、46、48、50、56、58、 
60、62， 使 用 带宽 为 10 的 均匀 核 函 数 ， 求 活 过 531 岁 的 概率 的 核 密度 估计 。 

25. 在 双重 减 因 模型 的 研究 中 ， 人 假定 个 人 生存 数据 爱 两 种 减 因 影 响 
( 见 表 8 一 17)。 

















表 8 -16 表 8 -17 
时 刻 死亡 数 风险 数 
3 1 55 
5 2 47 
6 5 k 
10 6 20 

















已 知 : (1) ge =0.06 对 所 有 j 成 立 ; (2) A 组 包含 1000 组 数据 ， 观 
测 期 从 0 开始 ; (3) A 组 仅 被 第 一 种 减 因 影响 。 求 A 组 至 少 能 活 到 60 岁 的 
人 数 的 Kaplan -Meier 多 重 损 因 估 计 。 
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口 掌握 完整 样本 数据 下 个 体 数 据 和 分 组 数据 的 矩 估 计 、 分 位 数 估 计 和 
极 大 似 然 估计 方法 

口 掌握 非 完 整 样本 数据 〔〈 存 在 删 失 和 蕉 断 的 数据 ) 的 短 估计 和 极 大 似 
然 估 计 方 法 

口 熟悉 极 大 似 然 估计 量 方 差 的 计算 ， 了 解 Fisher 信息 量 的 含义 

口 了 解 多 变量 和 参数 模型 的 特点 ,熟悉 二 元 变量 模型 、 和 模型 、Cox 模 
型 、 彤 义 线 性 模型 等 多 变量 参数 模型 的 参数 估计 


$% 1 完整 数据 情况 下 参数 的 点 位 计 


9.1.1 和 矩 估计 

假设 4 个 样本 观测 值 (x,，…，x,) 来 自 于 同一 个 总 体 。 总 体 分 布 函 
数 为 : 

F(x,0), 0 =(0,,0,,.…,0,) 
其 中 67 表示 9 的 转 置 ，9 为 列 向 量 , 含有 p 个 待 估 参 数 。 进 一 步 ， 令 1( 0) 
=E(X'|09) 表 示 阶 原点 距 , jw,(0) =E(( 针 -EE(X))*|9) 表 示 有 阶 中 心 距 。 
矩 估计 方法 的 基本 思想 是 求解 参数 9 使 得 样本 分 布 的 前 p 阶 原点 矩 等 于 经 
验 估计 的 前 p 阶 原点 矩 ， 即 





Mi(0) =p1, k=1,.…,p (9.1.1) 
有 时 也 可 以 用 中 心 矩 来 求 参 数 90， 即 
Ki(0) =p, k=1,.…,p (9.1.2) 


对 于 个 体 完 整数 据 ， 样 本 矩 的 计算 和 竹 佑 计 的 原理 在 数理 统计 教材 中 
都 有 详细 论述 ， 本 章 将 不 再 进行 叙述 。 对 于 分 组 数据 ， 由 它 的 光滑 经 验 分 
布 曲线 可 计算 丰 阶 样本 原点 矩 为 : 

Re Wi _ < mle 一 cm) 

人 名 | > 了 (Ci a 二 全 nle, — cu)(k+1) 


【 例 9-1]】 假设 用 伽 玛 分 布 来 拟 合 例 8 -1 的 数据 ,试用 和 矩 估计 方法 
计算 相应 的 分 布 参数 。 


解 : 对 于 伽 玛 分 布 ,， f(x) = 





(9.1.3) 


1 a~l -x/0 S 
TFT ， 矩 估计 方程 为 : 
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E(X) = ug =22 626.5 
E(X’) =a(@a+1)0 =2719 971 502 








解 得 : & =0.232, 6 =97 585. 27。 理 
【 例 9-2】 假设 某 险 种 的 表 9 -1 某 险 种 随机 理赔 数据 
随机 理赔 数据 分 布 如 表 9 -1 所 理赔 额 范围 理赔 数 
示 , 假设 理赔 额 服 从 帕 累 托 分 0-50 到 
布 ,f(x) ee 试用 和 矩 50 ~ 100 7 
(86+x)” 
100 ~ 200 9 
估计 法 估计 两 个 参数 a 和 6。 
200 ~ 400 16 
解 : 由 光滑 经 验 分 布 曲线 计算 样 0 29 
本 原点 和 矩 为 : 1 000 -2 000 12 
Se nc — Ci) 2 000 ~5 000 3 
Ce 名 (80) (2)(ci 一 ci ) 合计 80 





nlc + ce) 


(80)(2) 


(而 ] 25) + (而 ) 075) ( 襄 ) (150) + (#5) (300) 





29 12 3 
2| (700 LZ) (1 500 二 1(3 500) = 694.69 
wan) jo lo ) 
mc _ 1 [4(50’ -0) 3(5000’ -2 000’) 
‘5 和 a(3)(e em) 240l 50-0 1 53000-2000 | 
= 1 047 843. 75 
对 于 帕 标 托 分 布 ， 两 个 抢 估 计 方 程 为 : 
E(X) = =694.69 
c 一 1 
20" 
五 (和 及) = =1 047 843. 75 
人 
解 得 : Q =13.7，6 =8 806. 8。 各 


9.1.2 分 位 数 估计 

矩 估 计 的 基本 思想 是 求 取 参 数 9 使 分 布 的 矩 与 样本 的 矩 相 匹 配 。 分 位 
数 估计 法 则 是 另 一 种 匹配 法 ， 其 基本 思想 是 构造 一 个 模型 使 其 p 个 分 布 分 
位 点 与 实际 样本 的 p 个 分 位 点 相 匹 配 。 

定义 9 -1 假定 天 服从 分 布 函数 为 F(x) 的 分 布 ， 令 0 <p <1， 满 足 等 
式 F(T,) =P(X<7,) =p 的 7, 称 为 分 布 F(x) 的 p 分 位 数 。 当 p=50% 时 ， 
Tu: 称 为 中 位 数 。 

当 无 的 分 布 是 连续 分 布 时 ，p 分 位 数 是 唯一 确定 的 。 但 是 当 XX 的 分 布 
是 离散 分 布 时 ，P 分 位 点 并 不 总 是 有 明确 的 定义 ， 不 能 唯一 确定 。 例 如 ， 
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取 值 于 0 和 1 的 概率 均 为 1/2， 对 于 p=0.6 无 法 确定 分 位 数 ros。 因 此 分 位 
数 估 计 只 能 适用 于 连续 分 布 的 参数 估计 。 

当 样 本 数据 是 个 体 完 整数 据 时 ， 其 经 验 分 布 函 数 是 离散 的 分 布 ， 使 
用 分 位 数 的 一 个 问题 在 于 样本 分 位 点 的 确定 。 比 如 例 9 -1 的 数据 中 ， 
在 7 947 ~8 391 之 间 的 任何 一 个 数 ， 都 满足 有 10 个 观测 值 大 于 它 、 同 时 
又 有 10 个 观测 值 小 于 它 ， 因 此 都 可 以 作为 中 位 数 ， 但 习惯 上 我 们 使 用 这 
个 区 间 的 中 点 。 对 于 其 他 Pp 分 位 点 ,样本 的 经 验 分 位 点 通常 采用 插值 的 
方法 获得 。 如 果 随 机 变量 钱 有 个 观测 值 x,，x,，…，x,， 将 这 些 观 测 值 
从 小 到 大 排列 为 xo 二 xw) 志 … 专 x0， 对 于 0<p<1, g=[(n+1)p] 表 示 不 
超过 (n+1)p 的 最 大 整数 ， 此 时 认为 分 位 数 应 该 在 *x 和 x, 之 间 。 记 = 
(z+l)p-& 表 示 (Cz+li)p 的 小 数 部 分 ， 则 定义 样本 的 100p% 的 分 位 数 
如 下 : 

定义 9-2 个 体 数 据 的 100p 多 分 位 点 的 光滑 经 验 估计 为 : 

万 , = (1 一 瑚 )x + hx (9.1.4) 
当 p =50% 时 ，76; 称 为 样本 中 位 数 。 当 nn 为 奇数 时 ， 记 k= (n+1)/2， 


样本 中 位 数 为 4， 当 n 为 偶数 时 ， 记 4 =n/2， 则 样本 中 位 数 为 廊 x + 方 


xurwo 样本 中 位 数 是 位 置 平均 ， 不 受 极 大 值 和 极 小 值 的 影响 ， 主 要 用 于 测 
度 顺 序数 据 的 集中 趋势 。 

注意 ， 只 有 当 样 本 数据 中 没有 重复 的 观测 值 时 ， 定 义 9 -2 中 任何 两 个 
分 位 点 的 值 都 不 相同 。 另 外 ， 我 们 无 法 获得 p<1/(n+1) 和 p>n/(n+1) 
情况 下 的 值 。 这 个 结论 也 是 合理 ， 因 为 对 于 小 样本 我 们 不 应 期 望 能 够 得 到 
较 大 或 者 较 小 的 分 位 点 。 

对 于 分 组 数据 ， 根 据 其 经 验 分 布 公 式 








0 ， Xoo 
Cc,—x (x—ce,. 
(x) = Fl(e,. ) Sp (c, CsX <C， 
n pe n 3 1 
GT -i | Ci Ci-1 < 
1 ， 和 X > C， 


其 中 (6) = 二 Y mm 。 对 于 0 <p<1， 分 组 数据 的 样本 100p% 的 分 位 点 分 , 
定义 为 : 


p=F,(7,) (9.1.5) 
人 p-—F(c,1) 天 (ci) -Pp 

即 7 i ee Ny es x ci (9. 1.6) 
实 2 Cj 一 Cj 

或 者 T, = Ci-i 二 (np 到 2 n;) 人 (9. 1.7) 


得 


其 中 ， c- 和 Ci 满足 天 (ci) <DP<F(c)。 
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定义 9-3 分 位 数 估计 是 指 满 足下 列 p 个 方程 的 任意 解 : 
Te (0) =7p, k=1, 2, ,Pp (9. 1.8) 
其 中 ，&,，&8,，，…，&, 是 p 个 的 百分数 。 
当 只 有 一 个 待 估 参 数 时 ， 通 常 选取 50% 的 分 位 数 来 估计 参数 ; 当 有 两 
个 待 估 参 数 时 ， 通常 选取 25% 和 75% 的 分 位 数 来 估计 。 由 分 位 点 的 定义 可 
知 ， 方程 (9.1.8) 也 可 以 写成 
Flmg|10)=8, k=1,2, ,pp 
【 例 9-3】 设 表 9 -2 中 的 火灾 损失 额 服从 韦伯 分 布 ， 用 25% 和 75% 
分 位 数 来 估计 参数 的 值 。 


解 : 韦伯 的 分 布 函 数 为 : 表 9 -2 火灾 损失 数据 























a 0.1 0.5 2.2 4.1 28.1 
0 0.2 0.7 2.6 5.9 30.0 

2 " > 3 
0.2 0.9 2.9 6.2 49.2 

-zx'/0 py 
0.25=1-e“””， 解 得 : 

、 0.3 1.3 3.2 12.1 63.8 
x07s = (0 ln 4)7, 0.4 1.8 3.3 13. 65 118.0 











xi = (0 ln (473) )7 
由 于 0.25 x26 =6.5， 因 此 ， 
0. 25 的 分 位 点 为 : 0.5 x0.5+0.5 x0.7=0.6 
0.75 的 分 位 点 为 : 0.5 x12.1+0.5 x13.65=12.875 


类 似 地 ， 由 分 位 数 估计 法 12. 875 = (9 In 4)+，0.65 = (9 ln (4/3))+ 解 得 : 
y =0.S129，6 =2.675。 从 而 确定 了 损失 分 布 。 
【 例 9-4】 由 10 只 实验 老鼠 组 成 的 样本 ， 其 死亡 时 间 (以 天 为 单位 ) 
为 3、4、5、7、7、8、10、10、10、12。 假设 适 合 的 生存 模型 服从 Gomper- 
tz 分布， 利用 25% 和 65% 分 位 点 ,估计 参 数 B 和 c。 
解 : 由 n=10, 0.25 x11=2.75,，0.65 xll =7.15， 有 
To =0.25 x¥X,, +0.75 x¥X,, =4.75 
True =0. 85 x XX +0. 15 x Xs =10 
Gompertz 分 布 的 分 布 函数 为 : 


(3) 


(8) 


F(x) = eh 1m(l-e) ,x >0,B > 0,c>1 





In 1- In [1 -| 
因此 ， 770.25 = je » To6 = In ce 
令 moz =4- 75 ,7ros =10， 则 由 所 给 等 式 解 得 B =0. 039 ,c =1.1896。 加 


【 例 9-S】 某 责 任 险 保单 规定 了 保单 限额 为 30 万 元 ,， 表 9 -3 中 的 第 
1 至 3 列 给 出 了 该 险种 217 份 保单 的 理赔 额 情 况 。 假 设 理赔 额 服从 对 数 正 态 
分 布 ， 请 用 30% 和 70% 分 位 数 来 估计 参数 。 
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a ET 
表 9-3 某 责任 险 理 赔 情 况 
理赔 额 保单 数 平均 理赔 额 
0~2 500 41 1 389 
2 500 ~7 500 48 4 661 
7 500 ~12 500 24 9 991 
12 500 ~ 17 500 18 15 482 
17 500 ~22 500 15 20 232 
22 500 ~ 32 500 14 26 616 
32 500 ~47 500 16 40 278 
47 500 ~ 67 500 12 56 414 
67 500 ~ 87 500 6 74 985 
87 500 ~ 125 000 11 106 851 
125 000 ~ 225 000 5 I&4 733: 
225 000 ~ 300 000 4 264 025 
300 000 3 300 000 








解 : 经 验 分 布 30% 和 70% 的 分 位 点 分 别 为 : 
2 500 + (65.1 -41) x5 000/48 =5 010 
22 500 + (151.9 -146) x10 000/14 =26 714 
由 于 理赔 额 服 从 对 数 正 态 分 布 ， 因 此 In XX~N(m,，9), 令 5 010 和 
26 714 为 对 数 正 态 分 布 的 分 位 点 ， 即 
0.3 =@®B[ (ln 5 010 -1)/o] 
0.7 =®B[ (ln 26 714 -1)/o] 
解 方程 组 得 :6 =1.595871, 所 =9.356065 。 可 


2 

设 数据 集 由 个 事件 4,，…，4, 组 成 。 如 果 是 个 体 数 据 ， 则 4, 为 第 7 
个 观测 ， 它 是 通过 观测 随机 变量 得 到 的 。 如 果 是 分 组 数据 或 截断 数据 则 
4, 可 能 是 一 个 区 间 ， 例 如 在 w 处 删 失 的 观测 可 能 代表 发 生 在 w 到 正 无 穷 区 
间 的 事件 。 在 这 里 无 需要 求 X，…，X, 具有 相同 的 分 布 ， 但 是 要 求 其 分 布 
依赖 同一 个 参数 向 量 6， 而 且 这 些 随机 变量 要 相互 独立 。 

定义 9-4 似 然 函数 的 定义 为 


Z(6) = ITPcx e 4i|6) (9. 1.9) 


并 且 ，8 的 极 大 似 然 估计 是 使 似 然 函 数 取 最 大 值 的 向 量 。 
当 数 据 没 有 截断 也 没有 删 失 ， 并 且 每 一 个 点 都 被 记录 的 时 候 ， 很 容易 
写 出 似 然 函 数 和 对 数 似 然 函 数 : 
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L(0) = T/C%10), 1(0) = > in f. Cx, | 0) (9.1. 10) 

注意 这 个 表达 式 并 不 要 求 观 测 都 来 自 同一 个 分 布 。 对 于 个 体 完 整数 据 
的 极 大 似 然 佑 计 ， 在 一 般 的 统计 教材 中 都 有 详细 论述 ， 我 们 在 此 不 再 叙述 。 
下 面 的 例子 是 极 大 似 然 估计 在 生存 模型 中 的 应 用 。 
| 【 例 9-6】 对 于 由 5 个 从 出 生起 便 受 到 伤害 的 个 体 组 成 的 样本 ， 假 定 
死亡 力 为 年 龄 的 线性 函数 ， 即 4. = 姑 ， 如 果 和 死亡 发 生 时 间 为 1，2，3，4， 
5, 求 & 的 极 大 似 然 估 计量 。 

解 : 根据 死亡 力 函 数 可 以 推出 生存 函数 : 


S.(x) = exp| | aCs)as] a e-) bsds 2 
进而 推出 分 布 函数 和 密度 函数 : 

Fi(x) =1-S.(x)=1 二 ,fr (x) = bxe -2% 
根据 死亡 发 生 时 间 写 出 似 然 函数 : 


2 


L(b) = TI As E | se = 120b’e-”” 
对 数 似 然 也 数 为 : 

1(5) =5 ln b -27.56b+1n 120 
令 1(b) =0， 解 得 : 5 =2/11。 

当 数 据 是 完全 的 并 且 是 分 组 形式 时 ， 可 以 对 观测 值 进行 如 下 归纳 : 首 

先 选 取 一 组 数 co <cj <… <c,， 这 里 cs 是 最 小 的 可 能 观测 值 (通常 为 0)，, 6， 
是 最 大 的 可 能 观测 值 (通常 为 正 无 穷 ) 。 设 m 为 落 入 区 间 (c_, ce] 的 观测 数 
目 ， 这 种 数据 的 似 然 画 数 为 : 


L(0) = Iltre,|9) -Fl(c,,|09)]” (9.1.11) 
其 对 数 为 : 


1(0) = Dn ln[ Fc,|0) - Flc,.,|0)] (9.1.12) 


【 例 9-7】 考察 一 个 在 :=0 处 有 20 个 个 体 的 样本 ， 所 有 的 个 体 均 在 5 
周 内 有 死亡， 并 只 记录 每 周 的 死亡 人 数 ， 所 观察 的 结果 如 下 : 2 人 在 第 1 周 死 
亡 ; 3 人 在 第 2 周 死亡 ; 8 人 在 第 3 周 死亡 ，6 人 在 第 4 周 死 亡 ，1 人 在 第 5 
周 死亡 。 假 设 适 合 模型 为 指数 模型 ， 求 参数 9 的 极 大 似 然 估计 。 

解 : 画图 来 帮助 理解 ， 见 图 9 一 1。 


20 2 3 8 6 1 样本 (人 ) 
0 1 2 3 4 5 时 间 (局 ) 
图 9-1 
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对 于 参数 为 9 的 指数 模型 ，S(x) =e ”“， 那么 在 第 : 周 死 亡 的 概率 为 : 
S(i-1)-S(i)=e "ee "(ee -1) 
所 以 似 然 函 数 


L(0) 三 [Ile“ (一 1] 


5 
1( 9) =- > irm tne -Dyn 








加 
ph Dn 
dinL 1< 1 1 
全 a 二 = 0 不 
~ dg 2 [4 n 0 eL8 ,由 此 得 
5 
Yin 
We _ se 
€ 二 5 5 
py i 7P; 一 >» n 
1 


5 4 
由 n=2，n,=3, n,;=8,，n,=6,n,=1， 于 是 有 n, = 20,， i.n,=61, 
3 2 3 4 5 > 这 


因此 ，6=2.5170。 而 
【 例 9-8$】 假设 某 险 种 的 理赔 数据 如 表 9 -4， 若 假设 理赔 额 服 从 指数 
分 布 ， 试 用 极 大 似 然 估计 求 指 数 分 布 的 参数 6。 
解 : 若 假 设 理赔 额 服从 指数 分 布 ， 根 据 式 (9. 1. 12) ， 其 对 数 似 然 函 


- 数 为 : 


1(6) =99 In[ F(7 500) ~- F(0)] +42 In[ F(17 500) ~ F(7 500)] + 
+3 In[1—F(300 000)] =99 lnfl -es5o0] 
+42 In [ee "me + +3 In ee 


使 用 数值 算法 得 到 极 大 似 然 估 计 为 8 =29 721， 似 然 函 数值 为 -406.03。 量 








表 9 一 4 某 险 种 理赔 数据 
理赔 额 0 - 7 500 ~ 17 500 ~ 32 500 ~ 67500~ | 125 000~ 
300 000 + 
范围 7 500 17 500 32 500 67 500 125 000 300 000 | 
理赔 数 99 42 29 28 17 9 3 


【 例 9-9】 表 9 -5 给 出 了 茶 医疗 责任 保单 组 在 10 年 内 的 发 生 的 年 索 
赔 数 。 假 设 泊 松 分 布 和 负 二 项 分 布 都 适合 撒 述 这 张 保单 组 的 年 索赔 数 分 布 ， 
使 用 极 大 似 然 法 估计 泊 松 参数 和 负 二 项 分 布 参数 。 


表 9-5 某 医 疗 责任 险 年 索赔 数 


1999 2000 
; 
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解 : 可 以 按照 不 同 的 方法 对 这 些 数据 进行 综合 。 例 如 只 有 1988 年 这 一 
年 没有 发 生 索 赔 ，1990 年 、1993 年 这 两 年 都 只 发 生 了 一 次 索赔 。 统 计 结 果 
见 表 9 -6。 


表 9-6 医疗 责任 险 年 索赔 频数 






频数 (kk ) 
观测 数 ( n4) 








在 1985 一 1994 间 的 索赔 总 数 为 25 。 因 此 ， 平 均 每 年 的 索赔 次 数 为 2.5， 
这 个 平均 值 也 可 由 表 9 -6 算出 。 令 nn 表示 恰好 出 现 左 次 索赔 的 年 数 ， 发 生 上 
次 索赔 的 概率 为 p;， 则 整个 观测 集 的 似 然 印 数 和 对 数 似 然 函 数 分 别 为 : 


L= le:,’ 二 Dn ps 
对 于 泊 松 分 布 ， 有 


~ 入 、* 
e A 





Pi= pi ,lInp,= —A+klnA- lnk! 


对 数 似 然 葡 数 为 : 


1 = > nC(—-AtkInA- ln(k!)) = -Ant+t 》 kn ln A 一 > mln(CE1) 
k=0 k=0 


k=0 


其 中 中 = Dn 为 样本 容量 。 对 数 似 然 函 数 关 于 A 求 微分 ， 得到: 


dl < 1 
i 十 k pt 
dA bp mA 


令 对 数 似 然 函数 的 导数 值 为 零 ， 求解 后 可 以 得 到 极 大 似 然 估 计量 。 估 计 
量 为 : 





kn, 
入 -二 ee 
n 
对 于 负 二 项 分 布 ， 有 
r+k—l 


Pi = 





, jos 0<p<1, p+g=1, k=0,1,2,. 


其 对 数 似 然 函 数 为 两 个 参数 PP 和 rr 的 函数 : 


_ ~ (r+k—-1)! 
l= S| ep +kln(l —p) +rinp| 
为 了 求 对 数 似 然 函 数 的 最 大 值 ， 分别 对 每 个 参数 求 导 并 令 导 数 为 零 ， 
然后 解 参 数 。 对 数 似 然 函数 的 导数 为 : 
oal r k 
六 


op f0 p 1-Pp 


al > (r+k-1)-r 
Ominpt Oma Kl 


i 
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=nlnp+ Dn mtrrm) lnp+ Dn 
令 导 数 为 零 ， 解 得 : 








HP, (9. 1.13) 
p £=0 
Lf a 

(= 了 =- 二 立 w 人 (三 二 一 | (9.1.14) 


式 (9.1.13) 和 (9.1.14) 可 以 用 数值 方法 求解 。 将 Pp 用 r/( ++) 替换 
得 到 : 





Kir) = nn[1 + - 训 [ 吕 下 ) =。 (9.1.15) 


mn=u rr 十 7110. 
如 果 样 本 方差 大 于 样本 均值 ， 则 可 以 证 明 (9. 1. 15) 存 在 唯一 解 。 
用 Newton-Raphson 方法 对 方程 (9.1.15) 求 数值 解 ， 解 得 > = 10. 965 和 
D=0.186。 画 


$》 2 非 完整 数据 情况 下 参数 的 点 位 计 


对 于 非 完 整数 据 ， 本 节 将 运用 极 大 似 然 估 计 法 讨论 参数 模型 的 估计 。 虽 
然 矩 估计 法 和 分 位 点 匹配 法 也 可 以 用 来 估计 参数 ， 而 且 通 常 来 说 比较 容易 操 
作 ， 但 是 这 些 方法 还 是 有 一 定 缺 陷 的 。 首 先 这 些 方法 只 用 到 了 数据 的 部 分 性 
质 ， 没 有 能 够 充分 地 利用 全 部 数据 。 特 别 是 当 总 体 分 布 的 右 尾 很 厚 时 ， 是 否 
能 够 尽 可 能 充分 利用 数据 的 信息 显得 尤为 重要 。 例 如 ， 对 于 正 态 分 布 的 参数 
估计 ， 样 本 均值 和 方差 提供 的 信息 将 能 够 完全 代替 原始 数据 。 但 是 ， 在 估计 
帕 累 托 分 布 的 参数 时 ， 为 了 正确 估计 参数 a， 需 要 掌握 所 有 的 极 值 观测 ; 而 
当 数 据 存 在 删 失 情况 时 ， 这 些 数 据 的 极 值 观测 是 无 法 获得 的 。 其 次 ,这些 方 
法 要 求 所 有 的 观测 来 自 同一 个 随机 变量 ,否则 很 难 确 定 如 何 用 数据 来 描述 总 
体 的 矩 和 分 位 点 。 例 如 ， 当 一 半 的 观测 来 自 免 赔 额 为 100 的 业务 ， 而 另 一 半 
观测 来 自 免 赔 额 为 200 的 业务 时 ， 显 然 全 部 样本 的 样本 均值 是 没有 确切 含义 
的 。 最 后 ， 这 些 方法 允许 人 们 任意 选取 和 抢 的 阶 数 和 分 位 数 。 

根据 非 完 整数 据 存 在 右 删 失 和 左 截 断 的 情况 ， 我 们 分 别 讨论 以 下 几 种 
情况 的 极 人 似 然 估 站。 


9.2.1 石 删 失 数据 的 极 大 似 然 估计 

设 x,，x,，…，x, 是 随机 变量 对 的 nz 个 观测 ,将 它们 从 小 到 大 排列 
Xx) 夺 X02) 夸 … 筷 %x,)o。 假设 样本 数据 在 x =w 处 存在 右 删 失 ， 且 存在 1<hk<n 
使 得 xz <z2 和 xd ， 则 样本 数据 将 变 为 xz ，x，…，x，2，…z2。 似 然 
了 英 数 可 以 写 为 : 
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Z(6) = | TEAGxose) | SCu;0)™ (9.2.1) 


【 例 9-10】 承 例 9-4， 由 10 只 实验 老鼠 组 成 的 样本 ,假设 生存 模型 
服从 指数 分 布 ， 试验 样 本 的 死亡 时 间 (以 天 为 单位 ) 为 3、4、5、7、7、8、 
10、10、10、12。 假设 研 究 在 :=9 处 截 尾 ， 在 这 种 情况 下 估计 指数 参数 0。 

解 : 因为 研究 在 上 =9 处 截 尾 ， 所 以 数据 样本 是 右 删 失 的 ; 在 上 =9 处 ， 
已 经 有 6 只 死亡 ， 有 4 只 仍然 生存 ， 于 是 根据 式 (9.2.1) 有 


L = T/CG) Ls(9) 1 
根据 指数 分 布 的 性 质 有 : 
S(9) =e ,FE) = ， 上 =3,4;,5,7,7,8 
由 此 可 以 得 到 似 然 函数 : =0"“e”“，, 则 jnz= -6lnb6-706。 对 数 似 然 


函数 求 导 得 0 解 得 9 =70/6 = 11. 67。 
【 例 9-11】 已 知 某 险种 的 赔偿 限额 为 50， 随 机 抽取 的 12 个 理赔 额 分 
别 为 : 3，,，4，8，10，12，18，22，35，50，50，50，50。 假 设 实 际 损 失 额 
了 服从 在 [0，6] 上 的 均匀 分 布 ， 利 用 极 大 似 然 方法 估计 出 参数 6。 
解 : 因为 赔偿 限额 为 50， 所 以 理赔 数据 在 50 处 右 删 失 ; 根据 式 
(9.2.1) ， 在 赔偿 限额 为 50 的 条 件 下 ， 似 然 函 数 为 : 


Z(6) = [f(x.;0) (Ss(50))’ 
在 均匀 分 布 的 假设 下 ， 








S(50) = PIX>50] = 
于 是 似 然 孙 数 为 : 

£(0) = T/C%s0) (PLX > 501)° = (4) (09%) = (0 
dl(0) 4 12 人 
令 dg -50 = 0, 解 得 9 =75。 大 


.2.2 左 截断 数据 的 极 大 似 然 估 计 

当 数 据 存在 左 截断 时 ,截断 点 4 下方 数据 将 不 会 被 观测 。 例 如 假设 保 
单 具 有 免 赔 额 4， 和 那么 意味 着 小 于 d 的 实际 损失 额 将 不 会 被 报告 。 截断 数 据 
有 两 种 记录 方式 。 如 果 数 据 只 被 截断 ， 则 截断 后 的 观测 值 为 : 

Y=X|X>d (9. 2.2) 

称 了 为 在 d 点 截断 数据 。 若 半 表 示 实 际 损失 额 〈( 死 亡 时 间 )， 则 YY 即 为 高 
于 4 的 损失 (死亡 时 间 )。 

另 一 种 记录 方式 是 记录 超过 截断 点 d 的 部 分 值 ， 这 时 截断 后 的 观测 值 为 : 
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W=(X-d)|X>a (9.2.3) 
称 下 为 截断 且 被 平移 的 数据 。 若 d 表示 免 赔 额 , 天 表示 损失 事件 的 实际 损 
失 额 ， 则 多 就 是 每 次 理赔 事件 的 理赔 额 。 当 实际 损失 小 于 免 赔 额 d 时 ， 被 
保险 人 没有 获得 理赔 ， 理 赔 额 不 存在 ， 因 而 没有 定义 。 

设 总 体 分布 为 F(x，6) ，x!，*…，%, 为 没有 被 截断 的 观测 值 。 假 设 样 
本 数据 在 x=4d 人 处 存在 左 截断 ， 且 存在 1<k<n 使 得 x_i) 志 d <x6,。 如 果 只 
记录 d 点 截断 数据 ， 则 样本 数据 将 变 为 x ，xusnh，…，xe 如 果 记 录 的 
是 截断 县 被 平移 的 数据 ， 则 样本 数据 为 xb 一 d，x(iw) -d，…，xmw -4d， 用 
1，…，Wn-k 来 表示 。 

对 于 这 些 被 截断 的 数据 ， 一 般 有 两 种 处 理 办 法 : 一 种 是 对 数据 平移 ， 
即将 每 个 观测 点 减 去 截断 点 ; 另 一 种 方法 是 不 进行 平移 ， 认 为 数据 下 方 的 
数据 对 模型 的 拟 合 没有 带 来 任何 信息 。 对 截断 点 上 方 的 数据 设置 条 件 概率 ， 
似 然 函 数 中 的 概率 为 条 件 概率 。 具 体 来 说 : 

1. 平移 法 (The spiped model)。 对 于 被 截断 且 被 平移 的 观测 值 ， 由 于 
这 些 观 测 值 都 是 从 0 开始 被 记录 ， 从 数据 本 身 来 看 ， 就 像 没 有 被 截断 的 数 
据 。 假 设 被 截断 且 被 平移 的 观测 值 (w,，w,，…，w;) 具 有 与 没有 被 截断 的 
样本 相同 的 分 布 类 型 ， 只 是 参数 不 同 ， 那 么 就 可 以 不 考虑 截断 点 对 数据 的 
影响 直接 使 用 分 布 进行 估计 。 比 如 ， 若 d 表示 人 免 赔 额 ， 假 设 实际 损失 XX 的 
分 布 为 F(x，09) ， 若 每 次 理赔 事件 的 理赔 人 额 克 的 分 布 为 下 (xz，9')， 则 可 以 
直接 使 用 理赔 额 观测 值 对 参数 9' 进 行 估计 。 

对 于 只 被 截断 的 观测 值 ， 可 以 先 对 数据 平移 ， 即 将 每 个 观测 点 减 去 截 
断 点 ， 然 后 使 用 平 称 后 分 布 进行 估计 。 这 时 ， 似 然 函数 为 : 


Ww 


L(0) = If - a;0) = [lfCw;0) (9.2.4) 

【 例 9-32】 已 知 一 组 的 工伤 险 赔 付 数据 如 下 : 35、72、120、135、 

165、144、243、302、332、378、465、664、854、858、986、1 185、 

1 332、1 892、2 $67、15 730; 假设 它 在 200 处 从 下 方 被 截断 。 使 用 平移 法 

估计 已 知 9 =800 的 帕 累 托 分 布 的 参数 w， 并 计算 当 免 赔 额 为 0、200、400 
时 理赔 事件 理赔 额 的 期 望 值 。 

解 : 因为 数据 在 200 处 截断 ， 所 以 被 记录 下 来 的 样本 数据 只 有 14 个。 使 

用 数据 平移 法 ， 得 到 截断 且 被 平移 的 数据 为 : 43、102、132、178、265、 

464、654、658、786、985、1 132、1 692、2 367、15 5$30。 对 于 帕 累 托 分 布 ， 


f(x) = 一 29， 因此 似 然 函 数 为 : 
(x+0) 
_ 1 a(800°) 
em 1 (800 + w,)"" 
对 数 似 然 函 数 : 
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la) = DIlna+taln 800- (a+1)ln(w, + 800)] 
= 14 ln ca - 10.353a - 103.938 


令 1(a) =14/@a -10.353 =0， 得 & =1.352。 
下 面 计 算 不 同 免 赔 额 对 应 的 理赔 额 期 望 值 : 
(1) 免 赔 额 等 于 0。 因 为 数据 被 移动 了 ， 所 以 无 法 估计 无 免 赔 时 的 成 本 。 
(2) 当 免 赔 额 为 200 时 ， 这些 在 200 处 被 截断 且 被 平移 的 数据 可 看 做 
是 每 次 理赔 事件 理赔 额 的 样本 数据 ， 因 此 每 次 理赔 事件 的 理赔 额 期 望 值 为 


E(W) = Bh 800/0. 352 =2 272.7。 


(3) 当 免 赔 额 为 400 时 ， 等 价 于 在 这 些 截 断 的 数据 上 再 次 附加 免 赔 额 
为 200 的 条 款 ， 因 此 ， 每 次 理赔 事件 的 理赔 额 的 期 望 为 : 
800 | 800 六 





E(W) - E(WA200) _0.352\200 +800 
人 到 800 1. 352 =2 840. 85 加 
(zo + so0) 


2. 非 平移 法 。 如 果 不 对 数据 进行 平移 ， 建 立 似 然 函数 的 一 个 问题 是 对 
高 于 截断 点 4 的 那些 观测 值 设置 条 件 概 率 。 设 4 为 截断 点 ,了 Y 是 被 截断 后 六 
的 值 ， 设 天 的 分 布 函数 为 下 (xz) ， 由 式 (9.2.2) 知 工 的 分 布 为 : 





0， 人 0 ， x<d 
0 x>d “|e eg， x>d 
(9. 2.5) 
若 丰 是 连续 随机 变量 ， 则 工 的 密度 函数 为 : 
0 ， x<d 
ne -| fx) (9. 2.6) 
TEA Flay’ x>d 
因此 被 截断 后 的 观测 值 y,，…，y; 似 然 函 数值 为 : 
f(7.;0) 
Ll 1—-F(d;0) 
设 玉 为 被 截断 且 被 平移 后 的 值 ， 类 似 地 可 推出 WW 的 分 布 为 : 
0 ， Xs0 
Pr ede -p00) ee” (9.2.7) 
1-F(ld) ? ~ 
0 ， x<0 
fr(x) |e. (9.2.8) 
1 Fo -Fay， X >0 
因此 被 截断 且 被 平移 后 的 观测 值 w ，…，w 似 然 画 数值 为 : 
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E fw, + d;0) 
2 一 i=1 1—-F(d;0) 


【 例 9-13】 承 例 9-12， 已 知 一 组 人 造 的 工伤 险 赔付 数据 如 下 : 35、 
72、120、135、165、144、243、302、332、378、465、664、854、858、 
986、1 185、1 332、1 892、2 567、15 730; 假设 它 在 200 处 从 下 方 截断 。 
不 对 数据 进行 平移， 使 用 极 大 似 然 估计 已 知 9 =800 的 由 累 托 分 布 的 参数 w， 
并 计算 当 免 赔 额 为 0、200、400 时 理赔 事件 理赔 额 的 期 望 值 。 

解 : 观察 赔付 数据 可 知 有 14 个 数据 大 于 截断 点 200， 不 对 数据 进行 平 
移 ， 可 以 写 出 似 然 函数 (这 里 的 ” 为 原始 数据 ) : 








ER fx | a) 四 a(800*) 800 = 
0 lI 1-F(200|a) #1! [a + x ) (so 7 200) | 
a(l1 000°) 
C800 + x ) 
进而 可 得 到 对 数 似 然 函数 : 


14 


l(a) =14inawc+l4aln1000-(a+l)y》 In(800 +2) 
j=1 
= 14 ln ac +96.709aw - (w+1)105.76 
将 对 数 似 然 函 数 求 导 得 ,1'(a) =14a -9.051,， 令 1(a) =0 解 得 : ac =1.547。 


当 免 赔 额 为 200、400 时 ， 参 照例 9 -14 得 到 如 下 结果 : 
800 ( 800 ) 











E(X) - E(XA200) 0.547\200 +800) 
下 二 F(200) 于 800 1.547 =1 828. 15 
[5 | 
800 800 | 0.547 
E(X) —- E(XA400) 0. 和 | 击 | 
1 —F(400) 3 OD nm 
(zo0 + go00) 


【 例 9-14】 已 知 某 险种 的 免 陪 额 为 5 ， 随 机 抽取 8 个 理赔 事件 的 理赔 
额 如 下 : 3、4、8、10、12、18、22、35。 假 设 实 际 损 失 额 不 服从 指数 分 
布 ， 用 极 大 似 然 法 估计 其 参数 6。 

解 : 因为 最 终 要 估计 的 是 实际 损失 额 的 参数 ， 所 以 先 将 理赔 额 还 原 成 
实际 损失 额 ，x, = w + 4， 于 是 得 到 的 被 截断 样本 数据 为 8、9、13、15、 
17、23、27、40。 根据 式 (9. 2.6) 写 出 似 然 函数 : 

ung 
L(0) = IT: f(x,;0) ll ‘se ") 三 1 -zs-s04 
tt1-F(d;0) (Ce 0 


1 -{152 -40)/8 1 —-{112)/8 
2 ) et ) 


0 


”从 而 可 以 得 到 对 数 似 然 函数 : 
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1(6) = -81n0-112/0 


令 1(9) =0， 解 得 : 9=14。 - 
【 例 9-15】 100 个 x 岁 年 龄 组 的 人 群 中 ， 在 区 间 (x*，x +1] 上 观察 到 
有 98 人 生存 到 (x +1) 岁 ,2 人 死亡 ， 死 亡 分 别 发 生 在 (x+0.2) 岁 和 (x+ 
0.6) 岁 。 假设 在 区 间 (x，x +1] 死 亡 力 为 常数 ， 求 4 的 极 大 似 然 估计 值 。 
解 : 第 i 个 死亡 者 的 似 然 函数 值 由 在 x 岁 生 存 条 件 下 、 在 x, 处 死亡 的 
密度 函数 给 出 : 


S(x)h(x. 
Lf | X24) = ) 


如 果 令 i,=zx, -x 为 在 区 间 (x, x+1] 上 第 i 个 死亡 者 的 生存 时 间 ， 其 中 0 < 
志和 1 ， 则 有 
S(x+t)h(x+t) 





(9. 2.9) 





La 0 Se (9. 2. 10) 
将 所 有 的 死亡 者 的 似 然 函 数 相 乘 ， 得 到 : 
d, 
iPz “Hat (9.2.11) 
i=1° 
通常 记 为 : 
[pps 《全 二 全 


显然 , 对 (m - d,) 个 生存 者 ,他 们 的 似 然 函 数 为 (p.)™- 和 “= (1 - 
4.)” -上 ， 这 样 ， 总 的 似 然 函数 为 : 
a (9. 2. 13) 
为 求解 ， 需 用 4. 来 表示 ,p,* jw4s。 在 指数 分 布 假设 下 ，/.,, 为 常数 ， 即 
人 = 一 ln p,。 因 此 ， 
ap: = (Pp.)" =e™ (9. 2. 14) 
似 然 函 数 可 以 写成 : 
L = (p,)™- 4 . 本 Le :UL] = Ad exp[ -p(n, ~d,) -4: Si] 


inz=d .ln -HALGC -ad.) + 了》 二] 
5 








dlnL da > 
令 和 一 = 一 -[(n, -4d,) + 研 t,] =0， 解 得 : 
dx 人 风 5 
八 d, 
二 ? 
( -dd, + 万 
n ) 和 
、 入 _ 2 5 上 i 人 
所 以 ， /RD = 元 7 是 人 的 极 大 似 然 估 计 值 ， 从 而 4. =1 -ee “= 
1 -e。- 讽 =0. 020039。 
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2 23. 当 删 失 和 截断 闻 时 存在 时 的 极 大 似 然 们 计 


在 大 多 数 情 况 下 ， 右 删 失 和 左 截断 是 同时 存在 的 。 例 如 ,保险 责任 包 
括 免 赔 和 赔偿 限额 的 保单 理赔 额 ; 又 或 者 ， 在 特定 观察 期 肉 ， 对 某 个 观察 
对 象 的 观测 会 分 很 多 种 不 同情 况 : 从 初期 开始 观测 、 从 期 中 开始 观测 ; 对 
象 生 存 到 观察 期 末 、 对 象 在 观察 期 内 死亡 中。 对 各 种 情况 下 的 似 然 函数 ， 需 
要 分 情况 来 考虑 : 
1. 如 果 观 测 值 x; 没有 被 截断 或 删 失 ， 则 似 然 函 数值 为 f(x,); 
2. 如 果 观 测 值 x, 是 在 d, 被 截断 的 ， 则 似 然 昭 数值 为 fx,)/(1 -了 F(ad,)); 
3. 如 果 观 测 值 x; 是 在 d, 被 截断 且 被 平移 的 ， 则 似 然 薄 数 值 为 f(x, + 
d)/(1 -Fr(d.)); 
4. 如 果 观 测 值 x, 是 在 w, 被 删 失 的 ， 则 似 然 函 数值 为 1 -有 (zi)i 
5. 如 果 观 测 值 x, 是 在 d, 被 截断 且 在 ww, 删 失 的 ， 则 似 然 隔 数 值 
1—-F(u,) 
1-F(d,)® 
注意 到 S(x) =1 -F(x), f(x) =h(x)S(x)， 因 此 对 于 没有 被 平移 的 数 
据 ， 可 以 用 一 个 公式 来 表示 似 然 油 数 : 
~ S(x,) [h(x,)]” 1， 未 删 失 
Se [I S(d.,) 和 ‘es 在 zx, 删 失 
其 中 ， 若 观测 值 x, 是 在 w, 被 删 失 ， 则 记 x, = w。 
【 例 9-16】 考察 表 9 -7 所 示 的 6 个 接受 人 工 心脏 的 病人 的 样本 。 其 
中 4 人 在 2006 年 12 月 31 日 之 前 死亡 〈 见 表 ) ， 观 察 期 为 日 历年 2006 年 。 
假设 人 工 移植 心脏 病人 的 存活 时 间 服 从 指数 分 布 ， 由 所 给 样本 数据 估计 指 
数 分 布 参数 。 
解 : 由 于 观察 期 是 日 历年 


为 





(9. 2.15) 


表 9-7 接受 人 工 心脏 的 病人 的 生存 情况 





CE 病人 移植 时 间 死亡 时 间 

2006 年 ， 在 此 之 前 进行 心脏 移 1 2005. 1.1 2006.4.1 

植 手 术 的 病人 ， 在 进入 观察 期 时 2 2005.4.1 2006. 4. 1 
已 经 存活 了 一 段 时 间 ， 因 此 数据 3 2005.7.1 = 

是 被 截断 数据 。 而 观察 期 结束 后 4 2005. 10. 1 2006. 7. 1 
5 2006.1.1 三 

还 存活 的 病人 ， 其 死亡 时 间 未 6 2006.4.1 2006. 10.1 








知 ， 因 此 是 删 失 数据 。 根 据 上 述 
分 析 ， 这 6 个 样本 的 截断 点 和 真实 值 ( 删 失 点 ) 为 : dg =1, d,=0.75,，d,= 
0.5, d, =0.25, d; =0, ds =0; x =1.25, x, =1，x =1.5，x = 0.75， 


Q@ 本 章 只 考虑 单 风险 环境 下 参数 的 估计 ， 这 时 死亡 是 唯一 的 随机 事件 。 在 双 风 险 环 境 中 ,死亡 和 退出 
都 是 随机 事件 。 关 于 双 风 险 环境 下 参数 的 估计 ， 有 兴趣 的 读者 请 参看 李 晓 林 、 孙 佳美 主编 的 《生命 表 基 
础 》， 中 国 财政 经 济 出 版 社 2006 年 版 。 
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xs =1，xi =0.5， 其 中 xs、xs 是 删 失 点 。 则 根据 式 〈9.2. 15) ， 有 


6 ce 人 ( 方 ) 





L= II -7 
6 
lInL= > [~ x/0 +d/0+6,1n(1/0)] 
dlnL A : 
今 0 =0， 得 到 :9 = 》 (2 -97 之 5 = 3.5/4 = 0.875 。 


i=) 


【 例 9-17】 考察 在 区 间 (x,，x+1] 的 100 个 观察 对 象 ， 已 知 如 下 条 件 : 

(1) 有 70 个 对 象 在 x 年 年 初 开 始 被 观测 ， 那 么 截止 到 年 底 ， 观 测 到 16 
个 对 象 死 亡 

(2) 有 30 个 对 象 从 (x +0.6) 这 个 时 点 开始 观察 ，30 个 人 中 有 4 人 会 
在 年 底 前 有 死亡。 假设 死亡 力 服从 均匀 分 布 (UDD ) 假设 ， 用 极 大 似 然 方 法 估 
计 g,。 

解 : 用 7 来 表示 死亡 时 间 。 截 止 到 年 底 ，70 个 在 年 初 被 观察 的 对 象 中 
有 16 个 死亡 ，54 个 生存 。 对 于 每 一 个 对 象 来 说 死亡 概率 P[7T<1] =g9， 生 
存 概率 PL7>1] =1 -g。 对 于 30 个 在 (x +0.6) 才 开始 被 观察 的 人 来 说 ,4 
个 会 在 年 未 前 死亡 ，26 个 生存 。 

注意 ， 对 于 从 (x +0.6) 这 个 时 点 开始 观察 的 30 个 人 ， 它 们 在 (x,，x+ 
0.6] 上 的 信息 是 不 可 知 的 ， 所 以 它们 在 (x +0.6) 人 处 左 截断 。 
死亡 概率 〈 在 线性 均匀 分 布 假设 下 ) : 


P[LT<1|7>0.6] =,,.g,6= 0:4g 


1-0.6g 





生存 概率 为 : 


0.4g 1-g 
1-0.6g 1-0.6g 


由 此 可 以 写 出 似 然 函数 : 


L(g) <0 (1 -0) "(TS (Ts) 





1 一 4gos =1 


26 





， g" (1 -gqg)™” 
OE (1 -0.6g)” 


ln L(g) =4 ln(0.4) +20 Ing+80 In(1 ~g) -30 ln(1 -0.69g) 
















Eln Ca -0 
解 得 3 =0. 238。 表 9-8 基本 数据 
【 例 9 -18】 已 知 观测 到 20 ”损失 额 | 观测 数 [| 免 同 顿 | 保单 限额 
例 损失 额 (原始 值 ， 见 表 9 - 8) 。 2 . a 
经 验 显 示 ， 损 失 额 服从 参数 为 a 300 4 0 20 000 
和 9 的 帕 累 托 分 布 ， 且 已 知 参数 。 ”>1000%0 6 9 i0000 
400 4 


9=10 000， 用 极 大 似 然 法 估计 a。 


“201 


“ 202 ， 





人 -了 
解 : 帕 累 托 分 布 的 密度 函数 为 /(*) -77 eerr， 所 以 可 以 写 出 似 然 
函数 : 
_T_K750) 了 3 4 sf _f(400) 1° 
L ee F200 | 7(200) (300) [1-F(10 000)] Dn a 
_ Ta10 200°] Ta 10 000"1 Ta10 000°]“[10 000"1 Ta 10 300°]° 
加 [ 10 | | 10 | | 10 0 | 长 000* [ 10 | 
cc a"10 0002"10 750 20 000 “10 400 
于 是 得 到 对 数 似 然 函 数 : 
lInL=14 lnaw+l3a ln(10 000) -3a lIn(10 750) 
-6a ln(20 000) -4a ln(10 400) 
=14 ln a 一 4. 59327aw 
对 a 求 导 令 导 数 等 于 零 ， 解 得 & =3. 089。 


$ 9.3 区 间 估 计 和 方差 


本 节 将 计算 极 大 似 然 估 计 值 的 区 间 估 计 和 方差 ， 以 及 估计 值 的 某 些 函 
数 的 方差 。 在 一 般 情 况 下 ， 确 定 像 极 大 似 然 估 计 这 样 复 杂 估 计 值 的 方差 非 
常 不 容易 ， 但 还 是 有 可 能 对 其 估计 方差 进行 近似 。 其 计算 基础 就 是 Fisher 
信息 量 。 在 这 里 我 们 只 陈述 定理 的 结论 ， 不 给 出 证 明 。 其 中 ZL(8) 代 表 似 然 
函数 ，!(6) 代表 对 数 似 然 函 数 ， 所 有 的 结果 都 假设 总 体 的 分 布 是 某 个 参数 
分 布 族 的 成 员 。 

定理 9 -10 设 X，…,X, 是 独立 同 分 布 的， 其 概率 密度 函数 (在 离 
散 情 况 下 为 概率 函数 ) 为 /(x; 9) ，9 为 参数 ,， f(x; 9) 满足 以 下 条 件 (对 
于 离散 情况 下 面 的 积分 将 换 作 求 和 ) : 

(1) 参数 空间 Q 是 一 个 开 区 间 ; 

(2) 集合 4= {x|f(x，9) >0} 与 参数 9 的 取 值 无 关 ; 

(3) 对 任意 xe4, f(x,， 90) 对 9 三 次 可 微 ， 且 二 阶 导 数 是 9 的 连续 函数 ; 


(4) 积分 | f(x,9)qdx 在 积分 号 下 二 次 可 微 , 即 | 9 f(x;0)dx = 0， 
9 ey 
[sf(*;0) dr = 0; 
(5) - o < [f(x30) 入 Inf(x;0)dx <0; 


(6) 存在 函数 豆 (*)， 使 得 对 任意 xe4，6,-c<6<6+c， 满 足 


Q@ ”定理 的 叙述 和 详细 证 明 见 E. L Lehmann ，Theory of Point Estimation ，1983 ，John Wiley&Sons, pp415. 
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避 : 
[Exse)ac < “ ,并 且 | 3 








则 有 如 下 结论 成 立 : 
(a) 当 n 一 %w 时 ， 似 然 函 数 方 程 [L'(0) =0] 有 解 的 概率 趋 近 于 1; 


(b) 当 m yw 时， 极 大 似 然 估 计 值 9. 的 分 布 收敛 到 正 态 分 布 ， 均 值 为 
4， 方 次 满 尼 : 人 0) Yer(0,) 一， 其 中 ， 


2 


1(0) = -ng[ 吉 f(x;0) dx 








a ] = 2 /fs;0) a dx 
定理 的 第 二 个 结论 表明 ， 对 于 任意 的 z:， 有 


= (9.3. 1) 

根据 定理 9 -1，[1(9)] -为 yar(6,) 的 一 个 有 意义 的 估计 ， 称 1(9) 为 
Fisher 信息 量 。 由 这 个 结果 我 们 得 到 极 大 似 然 估计 量 是 渐 近 无 偏 和 相合 的 。 
信息 量 同 时 构成 了 Cramer - Rao 下 界 ， 也 就 是 说 在 一 般 条 件 下 ， 任 何 无 偏 
估计 量 的 方差 都 大 于 由 信息 量 的 倒数 给 出 的 方差 。 因 此 ， 至 少 在 渐 近 意义 

上 ， 没 有 哪个 无 偏 估计 比 极 大 似 然 估计 更 准确 。(1) ~ (6) 给 出 的 条 件 被 称 
为 “一 般 正 则 性 条 件 "。 这 些 条 件 通常 是 成 立 的 ， 但 是 难以 验证 ， 所 以 只 
是 假设 这 些 条 件 都 是 成 立 的 .0 这 些 条 件 将 确保 密度 函数 对 参数 比较 光滑 ， 
并 且 密 度 函 数 比较 正常 。 

上 面 的 叙述 假设 样本 由 独立 同 分 布 的 随机 变量 观测 组 成 。 更 一 般 的 结 
果 用 对 数 似 然 函 数 表示 : 


1(0) = -a[ S10)] = 可 (Co)) ] (9. 3.2) 


这 里 唯一 的 要 求 是 每 个 观测 的 参数 值 相 同 。 

如 果 有 一 个 以 上 的 参数 ， 结 论 只 是 改 为 参数 向 量 的 极 大 似 然 估计 服从 
渐 近 的 多 元 正 态 分 布 。 这 个 分 布 的 协 方 差 阵 通过 求 一 个 〈r，s) 处 元 素 ， 
由 下 式 给 出 的 矩阵 的 逆 得 到 : 








7T(6).。= -ze[55x9)] = -ng[ Boo AX; 9)] 
9 





=E[ 61(0) a0 0)] =nE[ 36 ln fCX; D3 ln /CX; 0)| 


@@ 如果 总 体 分 布 是 自然 指数 型 的 ， 这 些 条 件 成 立 ， 见 陈 希 儒 的 《高 等 数理 统计 》， 中 国 科 学 技术 大 学 
出 版 社 1999 年 版 ,第 176 页 。 
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其 中 第 一 和 第 三 个 表达 式 都 是 在 一 般 情 况 下 成 立 ， 第 二 和 第 四 个 表达 式 假 
设 似 然 函 数 是 ”个 相同 密度 枉 数 的 乘积 。 这 个 和 矩阵 通常 称 为 “信息 阵 ”。 为 
保证 斑 (9) 存 在 ， 通 常 要 求 信 息 矩 阵 1(9) 是 正定 的 。 

【 例 9-19】 估计 对 数 正 态 分 布 的 极 大 似 然 估 计量 的 协 方差 阵 。 然 后 
计算 例 9-1 数 据 的 相应 结果 。 

解 : 似 然 函 数 和 对 数 似 然 函数 为 : 




















2 
A exp| | 
i XO V27 20 
和 1 l/lnx,— uy’ 
Il(u,o) = Bl- -no -Fn(27) 0 ) | 
它们 的 一 阶 导 数 为 : 
al ~ lnx—u al n " (ln x, — LL)? 
一 一 二 一 二 
Ou 后 人 or Cr pe or 
二 阶 导 数 为 : 
ol ee 
ou” oo 
3927 2，ln x， 一 了 
二 2 》， 人 
oo ou j=1 Oo 
?7 ln x, — 1)’ 
9 = 3 了 《 二 ) 
oo Cr 全 Cr 


由 于 In X, 服从 均值 为 w， 标 准 差 为 o 的 正 态 分 布 ， 因 此 ， 


?27 2 27 
o 半 -- - 
OO 








du’ dudo der o 
政变 符号 后 求 道 可 得 到 协 方差 阵 的 估计 : 
0o 
n 
oo 
oF 
对 于 对 数 正 态 分 布 ， 极 大 似 然 估 计 是 下 面 两 个 方程 的 解 : 
~ lnx—u _e gx (ln x —u) 
DD = 0 且 人 = 0 


由 第 一 个 等 式 得 到 立 = (1/n) 六 In ws, 由 第 二 个 等 式 有 2 = (1/n) > (ln % - 
LL) 。 加 
对 于 例 9 -1 的 数据 ， 这 些 值 分 别 为 i =9. 127 和 人 = 1. 563 。 协 方差 抵 
阵 需要 参数 的 真 值 ， 但 能 够 做 到 的 最 好 方法 是 使 用 估计 什 代 车 真 值 。 于 是 
得 到 参数 /.，o 的 极 大 似 然 估计 值 的 方差 估计 值 ; 
0. 07815 0 
0. 03908 


Var (&, HS) = 
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主 对 角 线 外 的 0 说 明 这 两 个 参数 估计 渐 近 不 相关 。 在 对 数 正 态 分 布 这 个 
特殊 情形 下 ， 这 个 结论 对 任何 容量 的 样本 都 是 成 立 的 。 因 此 可 以 构造 一 个 置 
信和 度 为 95% 的 参数 真 值 的 置信 区 间 ， 在 估计 值 两 边 的 1. 96 个 标准 差 内 有 

:9. 127 +1.96(0.07815)'” =9. 127 +0.548 
o:1.25 +1.96 (0.03908)'” =1.25 +0. 3871 

为 了 得 到 信息 阵 需 要 计算 导数 和 期 望 值 ， 这 通常 并 不 容易 。 避 免 这 个 
问题 的 一 个 方法 是 不 计算 期 望 值 ， 直 接 使 用 观测 数据 。 这 个 结果 称 为 “已 
观测 信息 量 ”。 

【 例 29-20】 使 用 已 观测 信息 量 估计 前 例 的 协 方差 阵 。 

解 : 将 观测 值 代 和 人 二 阶 导 数 方程 得 到 : 





























ol nn _ 20 
a ar ar 
2 ” lnx,— 
ol 25 i 2 2 182. 54 204 
00 Pes] CT oO 
ol n " (lnx,—-u)’” 20 1 697.2487 - 365. 08u + 20z 
2 二 2 3 >》 4 De 3 4 
OO CT 有 Or CT oO 
带 入 参数 的 估计 值得 到 观测 信息 的 负 值 项 : 
六 2 党 
RR eR 生 信 全 和 全 
9 90 a0 
改变 符号 求 逆 得 到 了 和 前 面相 同 的 结果 ， 这 是 对 数 正 态 分 布 的 特点 ， 对 于 
其 他 分 布 并 不 一 定 成 立 。 奋 


信息 矩阵 提供 了 一 种 评价 参数 的 极 大 似 然 估 计 质 量 的 方法 。 但 是 ， 人 
们 更 关心 作为 参数 淆 数 的 某 些 量 的 估计 。 比 如 ， 我 们 希望 以 帕 累 托 分 布 的 


均值 作为 总 体 均值 的 估计 。 也 就 是 说 ， 以 &9/(& -1) 作 为 总 体 均 值 的 一 个 
估计 ， 其 中 采用 了 极 大 似 然 估计 值 。 计 算 这 个 随机 变量 的 均值 和 方差 是 很 
困难 的 ， 因 为 其 中 的 两 个 随机 变量 的 分 布 已 经 相当 的 复杂 。 对 于 参数 函数 
的 估计 ， 常 用 方法 为 delta 方 法 。 定 理 9 -2 给 出 了 该 方法 的 描述 。 

定理 9 -2 令 久 ,= (X,,…,X,)" 表示 一 个 容量 为 n 的 & 维 多元 随机 变 
量 样本 。 假 设 头 服 从 渐 近 正 态 分 布 ， 均 值 为 96， 协 方差 阵 为 jn， 其 中 9 和 
三 都 不 依赖 于 n，g 是 一 个 完全 可 微 的 下 元 函数 ，C, =g(X,,,…,X,)， 则 C， 
也 服从 均值 为 g(9)、 方 差 为 (9g) "(98)/n 的 浙 近 正 态 分 布 。 其 中 ，9g 为 
一 阶 导 数 向 量 3g = (3g/86,，…，ag/36,)7， 而 且 取 值 于 原 随 机 变量 参数 的 
真 值 9。 

定理 9 -2 的 陈述 比较 难 解释 。X 是 估计 量 ，g 为 待 估 参 数 的 函数 。 对 


于 单 参数 模型 ， 这 个 定理 的 陈述 如 下 : 令 6 为 9 的 估计 量 ， 服 从 均值 为 9、 
方差 为 o*/n 的 渐 近 正 态 分 布 。 则 g(0) 也 服从 渐 近 正 态 分 布 ， 均 值 为 g(9)， 
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精算 模型 


渐 近 方差 为 : 
[g’(0)](o/n)[ge’(0)] =[ge’(0)]o/n (9. 3.3) 
【 例 9-21】 使 用 delta 方 法 给 出 指数 分 布 超 过 4 000 的 概率 值 的 极 大 
似 然 估 计 的 方差 ， 然 后 计算 例 9 -1 数据 的 结果 。 
解 : 指数 分 布 参数 9 的 极 大 似 然 估 计 是 样本 均值 。 要 估计 的 量 为 : 
p=P(X>4 000) =exp ( -4 000/9) 
其 极 大 似 然 估 计 为 : 


b=exp (~—-4000/0) =exp ( -4 000/ x ) 


计算 这 个 估计 量 的 均值 和 方差 并 不 容易 ,但 是 已 知 Var( Y) = Var(X)/n 
=0/n， 进 一 步 地 ， 有 
8(0) =e™™”,g’(0) =4 0000 ee 
因此 ， 由 delta 方法 ， 有 


(4 0000 ee 四 16 000 0000 ?es 
n n 


Var(p) = 





对 于 例 9 -1 的 数据 ， 有 
x =22 626.5 
P=exp ( -4 000/22 626.5) =0. 8380 

16 000 000 (22 626. 5) es".5 


n 





Var($) = =0.001097 


因此 ,pp 的 95% 置信 区 间 为 0. 838 上 1. 96 V0.001097， 即 (0.773，0.903)。 
[J 
【 例 9-22】 利用 例 9 -1 的 数据 构造 对 数 正 态 总 体 均 值 的 95% 置信 区 
间 。 将 这 个 结果 与 由 传统 方法 样本 均值 得 到 的 置信 区 间作 比较 。 
解 : 由 例 9. 3.2 得 到 鼠 =9. 127 和 和 =1.2502 ， 两 个 估计 量 的 协 方 差 矩 
阵 为 : 
2 07815 0 
0 0. 03908 


7 


函数 g(u,0) =exp (1+ 地 0 )， 偏 导数 为 : 


98 _ 1 2 98 _ 1 2 
3 = XP («+ 20 ) ,ar = oP (ut Fo ) 
这 些 量 的 估计 值 分 别 为 20 100.5 和 25 129.65。 由 delta 方法 得 到 下 面 的 
估计 : 
0.07813 0 20 100. 5 
yur[g( 立 ,人 ) ] = [20 100.5 25 129.6] || | 
0 0. 03908」 几 25 129.6 


=56 253 771. 0 
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置信 区 间 为 20 100.5 上 + 上 14 700.5， 即 (5 400，34 801 ) 。 恒 


按照 传统 方法 ， 总 体 均 值 的 置信 区 间 为 样本 均值 的 邻 域 未 + 1.96s/Vn， 
这 里 s 为 样本 方差 。 对 于 例 9 -1 的 数据 ， 这 个 区 间 为 22 626.5 +20 594. 1 。 
这 是 一 个 更 大 的 区 间 ， 这 并 不 奇怪 ， 因 为 我 们 知道 (对 于 对 数 正 态 分 布 ) 
极 大 似 然 估计 量 是 渐 近 的 一 致 最 小 方差 无 偏 估计 。 

【 例 9-23】 已 知 累 积 危 险 率 函数 忌 (5) 的 95% 置信 区 和 间 为 (0. 283 ， 
1. 267) ， 使 用 delta 方法 求 5(5) 的 95% 的 置信 区 间 。 


解 : 该 置信 区 间 的 中 点 为 0.775， 即 入 =0.775。 由 
(0.775 -1.96 VV Var( PB(S)) ,0.775 +1.96 W Var( (5) ) | = (0.283, 1.267) 


dS(i) _ 
”CECi | 





知 Var( 太 (5)) 的 估计 值 为 0.063。 因 为 S(t) =exp ( -H(t)) 
e 0 ， 由 delta 方法 ， 


Var( $(1)) = (ee )Var(A()) 
代入 到 (5) =0.775,Var( 和 六 (5)) =0.063， 得 : 
Var($(5)) =(e "75)20.063 =0.0134 


S(5) 的 估计 和 值 为 e*”=0.4607， 置 信和 区 间 为 0.4607 + 1.96 V0.0134 = 
(0.23，0. 69 ) 。 


$》% 4 乡 变量 的 参数 模型 


9.4.1 引言 

前 面 所 讨论 的 参数 模型 都 是 针对 单 变 量 的 ， 在 精算 模型 中 所 关心 的 随 
机 变量 也 可 能 受到 其 他 变量 的 影响 ， 或 者 受到 被 保险 人 的 风险 特征 变量 的 
影响 。 本 节 将 考虑 这 两 种 情况 下 的 多 变量 参数 模型 。 

当 随 机 变量 依赖 于 其 他 变量 的 取 值 ， 可 建立 相互 依赖 变量 模型 。 例 如 
联合 生命 年 金 或 者 寿险 的 情形 ,保险 赔付 的 时 间 依 赖 于 第 一 个 或 者 第 二 个 
个 体 的 死亡 。 因 为 这 些 个 体 通 常 是 相关 的 《典型 的 如 夫妇 )， 死亡 时 间 相 
互 依赖 。 

按照 年 金领 取 人 分 类 ， 我 们 所 熟知 的 年 金保 险 可 以 分 为 个 人 年 金 和 联 
合生 存 年 金 。 个 人 年 金 是 指 以 一 个 被 保险 人 的 生存 作为 给 付 条 件 的 年 金保 
险 ; 联合 生存 年 金 是 指 以 两 个 或 两 个 以 上 的 被 保险 人 的 生命 作为 给 付 年 金 
的 条 件 的 年 金 。 联 合生 存 年 金 又 可 以 分 为 共同 生存 年 金保 险 和 最 后 生存 者 
年 金保 险 。 以 两 个 被 保险 人 为 例 ， 前 者 是 指 如 果 联 合 投 保 人 中 有 一 人 死亡 ， 


年 金 给 付 即行 停止 ; 后 者 是 指 直到 所 有 被 保险 人 都 死亡 ， 年 金 给 付 才 停止 。 
【 例 9-24】 一 对 夫妇 购买 了 共同 生存 年 金保 险 。 购 买 该 保险 时 ， 丈 








夫 64 岁 ， 妻子 63 岁 。 假 设 丈 夫 的 生存 函数 为 5,(1) =23 二 ,0<1<36; 雪 
子 的 生存 函数 为 5,(!) = 2 了 ,0<i<37。 假 设 夫妇 二 人 的 死亡 时 间 独 立 


(在 大 多 数 联 合生 存 模 型 中 ， 两 个 个 体 的 生存 时 间 一 般 是 相互 影响 的 ， 此 处 
的 独立 性 假设 只 是 为 了 建 模 方便 ， 更 符合 现实 的 情况 将 在 9.4.2 中 讨论 )， 
那么 在 第 10 年 末 时 ， 此 共同 生存 年 金保 险 的 给 付 仍 未 终止 的 概率 是 多 
少 呢 ? 

解 : 显然 ， 只 有 当 两 个 人 在 第 10 年 末 时 部 生存 ， 共 同 生 存 年 金保 险 的 
给 付 才 不 会 终止 。 设 共同 生存 年 金保 险 的 未 来 给 付 时 间 为 TY， 即 求 已 (人 > 
10) =Si(10)， 因 为 夫妇 二 人 的 死亡 时 间 独 立 ， 可 得 : 

P(T>=10) =S,(10) =S,(10) . S,(10) =0.73 x0.72 =0. 527 

当 随 机 变量 的 分 布 可 能 会 依赖 于 被 保险 人 的 特定 属性 时 ， 考 虑 建立 包 
含 伴随 变量 的 多 变量 模型 是 比较 合适 的 。 例 如 ， 考 虑 x 岁 的 人 在 x+i 岁 时 
仍 生 存 的 概率 S(:) =P(T>zi)， 其 中 了 表示 x* 岁 的 人 的 未 来 寿命 。 显 然 不 
同年 龄 的 人 在 :年 后 仍然 生存 的 概率 是 不 同 的 。 因 此 ， 在 建立 精算 生存 模 
型 时 ， 考 虑 年 龄 对 生存 函数 的 影响 是 十 分 必要 的 。 这 时 ， 生 存 函 数 就 变 为 
S(t;x) =POT>iti)。 除 了 年 龄 之 外 ， 投 保 人 的 职业 、 地 域 、 吸 烟 与 否 、 血 
压 、 身 高 、 体 重 等 都 会 对 未 来 寿命 造成 影响 ， 这 些 因素 都 可 以 作为 伴随 变 
量 被 加 入 到 生存 模型 中 。 又 如 考虑 机 动车 辆 的 年 索赔 数 ， 这 个 随机 变量 的 
分 布 可 能 与 机 动车 的 驾驶 里 程 、 轰 驶 地 区 和 主要 驾驶 员 的 状况 如 年 龄 、 人 性 
别 、 婚 姻 状 况 和 驾驶 记录 有 关 。 

假设 我 们 考虑 的 目标 变量 了 半 ， 受 m 个 伴随 变量 z;,，z,，…-，z, 的 有 影响， 
令 Z= (zz ，…，z)'，S(t |Z) 代 表 加 入 伴随 变量 Z 之 后 的 生存 函数 ， 
六 《ti| 乙 ) 表 示 相 应 的 危险 率 函 数 , 蕊 的 密度 函数 为 FlZ)。 我 们 可 以 得 到 
如 下 关系 : 


h(i|2Z) = -SIns(s|Z) (9.4.1) 
s(1|Z) = exp[ - {hlw |Z) dw (9. 4. 2) 
fl(i1|2Z)=S(it|2Z)h(|2Z) (9. 4. 3) 


那么 我 们 只 要 能 够 得 到 S(i |Z) 和 h(i|Z) 的 数学 表达 式 ， 就 可 以 通过 
样本 数据 ， 计 算 似 然 函 数 工 ， 对 工 求 最 大 值 来 估计 生存 模型 中 的 参数 了 。 又 
根据 式 (9.4.1) 和 (9.4.2) ， 我 们 实际 上 只 需要 知道 上 (ti|Z) 的 形式 ， 就 可 
以 进行 参数 估计 了 。 但 是 ,由 于 伴随 变量 以 及 其 他 许多 因素 的 影响 ，S(t 
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| ZZ) 和 h(z| 艺 ) 的 形式 有 时 非常 复杂 。 因 此 ， 常 常 需要 对 h(t|Z) 或 S(t| 2) 
的 形式 进行 假设 。 

【 例 9-25】 假设 汽车 保险 的 事故 次 数 与 驾驶 员 的 年 龄 和 性 别 有 关 ， 
请 对 该 保险 的 事故 次 数 建立 合适 的 模型 。 

解 : 可 以 有 三 种 不 同 的 建 模 方式 : 

(1) 对 每 一 个 性 别 和 年 龄 的 组 合 分 别 建立 模型 。 这 需要 搜集 每 一 个 组 
合 的 事故 次 数 数据 。 该 种 方法 的 缺点 是 繁琐 , 待 估 参数 个 数 多 ， 有 可 能 存 
在 数据 量 不 足 的 问题 。 

(2) 建立 统一 的 参数 模型 。 壁 如 ， 假 设 给 定 驾 驶 员 的 事故 次 数 服从 参 
数 为 A 的 泊 松 分 布 ， 而 泊 松 参数 又 与 年 龄 (*) 和 性 别 ( y = 1 为 男性 ， 
y = 0 为 女性 ) 有 关 ， 如 : 

A=(ao+t+ax+Qsx )B’ 或 者 入 =e”'” 
此 方法 的 特点 是 参数 较 少 ， 可 以 用 通常 的 方法 进行 估计 ， 比 较 适 合 上 述 的 
车 险 事 故 次 数 。 

(3) 从 一 个 密度 函数 、 分 布 冰 数 或 危险 率 函 数 模型 出 发 ， 用 年 龄 和 性 

别 对 这 个 函数 进行 修正 。 | 





SCn lm) = [86] (e+e me 
显然 后 两 个 模型 较 第 一 个 模型 更 优 ， 因 为 某 些 年 龄 和 性 别 的 组 合 可 能 
没有 观察 值 或 观察 值 很 少 。 此 时 ， 第 一 个 模型 就 无 法 应 用 ， 而 后 两 个 模型 
仍然 可 以 应 用 这 些 信 息 ， 并 且 待 估 参 数 的 个 数 较 少 。 当 给 定 的 个 体 不 满足 
任何 明显 的 分 布 模型 时 ， 第 三 个 模型 将 是 不 错 的 选择 。 对 于 汽车 保险 的 例 
子 ， 泊 松 分 布 是 一 个 合理 的 选择 ， 因 此 第 二 个 模型 可 能 是 最 好 的 方法 。 


9.4.2 二 元 变量 模型 

正如 在 例 9 -23 中 介绍 的 那样 ， 同 时 考虑 相互 依赖 的 二 元 变量 构造 的 
模型 就 称 为 “二 元 模型 "。 二 元 模型 的 理论 基础 就 是 概率 论 中 联合 密度 函 
数 和 边缘 密度 函数 。 

显然 ， 如 果 我 们 所 考虑 的 两 个 变量 之 间 独 立 ， 那 么 二 元 变量 的 密度 
(分 布 ) 函数 就 等 于 这 两 个 变量 的 边缘 密度 (分布 ) 函数 的 乘积 。 因 此 ， 
只 要 已 知 边 缘分 布 ， 构 造 二 元 分 布 就 变 得 非常 简单 。 

但 是 ， 在 实际 问题 中 ,我 们 所 考虑 的 两 个 变量 往往 是 相关 的 。 例 如 ， 
沿用 之 前 联合 生存 年 金 的 例子 ， 夫 妇 二 人 的 生存 时 间 通 常 并 不 是 独立 的 ， 
丈夫 的 死亡 可 能 使 妻子 的 寿命 缩短 。 此 时 ， 将 边缘 分 布 相 乘 直 接 得 到 二 元 
分 布 就 不 合理 了 ， 就 需要 将 两 变量 之 间 的 相关 性 引入 模型 。 引 入 相关 性 的 
方法 有 很 多 种 ， 这 里 只 介绍 在 精算 实务 中 应 用 比较 广泛 的 耦合 (Copula) 
分 布 。 
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想 合 分 布 是 采用 一 个 耦合 函数 进行 构造 的 ， 这 个 函数 本 身 必 须 为 单位 
正方 形 上 的 一 个 正规 的 二 元 分 布 范 数 ， 其 边缘 分 布 为 均匀 分 布 。 用 F(x) 
和 FF,(y) 表示 两 个 边缘 分 布 消 数 ，C(w,，v) 表示 耦合 函数 。 由 这 三 个 函数 

Fry(x,y) =CLF.(x) ,Fy(y)] (9.4.4) 

耦合 函数 比较 简单 的 形式 为 C(w,v) = wv， 由 此 构造 的 二 元 分 布 旺 数 为 
Foy(x,y) =Fi(x) Fy(y)， 相 互 独立 变量 的 联合 分 布 就 是 这 个 表达 式 。 但 是 
正如 前 面 所 讨论 的 那样 ， 现 实 问题 中 我 们 所 研究 的 变量 之 间 通 常 是 相关 的 ， 
所 以 这 种 耦合 郴 数 的 形式 并 不 常用 。 

比较 常用 的 耦合 画 数 形 式 为 Frank 耦合 函数 ， 其 具体 形式 如 下 (其 中 
log。 表示 以 a 为 底 的 对 数 ) : 

(o -1)(a -1) 


Q 一 1 

参数 a 用 来 控制 两 个 变量 之 间 的 关联 性 。a 的 值 小 于 1 工 表 示 正 向 关联 
性 ， 大 于 1 表示 反 向 关联 ， 等 于 1 表示 两 变量 之 间 独 立 。 则 式 (9.4.4) 就 
变 成 如 下 形式 : 


Cl(u,v) =log.| 1 + (9.4.5) 








F(x Pr(7) 
Fis(#,y) =log.[1+ 2 -1)(e -| (9.4.6) 
a-—1 
令 B=In a， 则 式 (9.4.6) 也 可 以 写成 : 
_1 i Ce 1) 
Foy (x, Y) = | en | (9.4.7) 


这 样 ， 如 果 我 们 给 定 了 单个 变量 的 边缘 分 布 函 数 F(x)，Fy(y) 以 及 
参数 a， 就 可 以 得 到 二 元 变量 模型 了 。 

【 例 9 -26】 设 一 对 夫妇 购买 了 最 后 生存 者 年 金保 险 ( 即 只 要 有 一 个 
被 保险 人 生存 ， 年 金 的 给 付 就 不 会 终止 ) ， 购 买 保险 时 丈夫 60 岁 ， 妻 子 50 
岁 。 隐 出 生 的 个 体 的 剩余 寿命 服从 De Moivre 定律 ， 极 限 年 龄 总 =100。 假 
设 两 人 的 剩余 寿命 间 的 关系 由 Frank 耦合 丽 数 表示 ，a =。 ， 求 此 共同 牛 存 
年 金保 险 在 10 年 内 停止 给 付 的 概率 。 

解 : 设 丈夫 的 琵 余 寿命 随机 变量 为 X， 妻 子 的 剩余 寿命 变量 为 了。 由 
De Moivre 定律 ， 可 求 得 边缘 分 布 为 : 


F(x) = 和 Fr(7) = 


已 知 aw=e， ye 代入 公式 (9.4.7)， 可 计算 二 元 分 布 函 
数 为 : 
De) 


1 
Fer,7) = Bin[1+ ee 





(er" 项 -1)(e* 区 -1) 
e" -1 | 
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此 共同 生存 年 金保 险 在 10 年 内 停止 给 付 的 概率 为 : 


0.5 癌 _1 0.5 号 二 江 
F,,(10,10) =551n[! + =0. 0427 攻 


【 例 9-27】 假设 索赔 数据 变量 XX 和 相应 的 直接 理赔 费用 YY 通常 具有 
很 强 的 正 相 关 性 ,假设 它们 的 边缘 分 布 均 为 帕 累 托 分 布 ， 使 用 Frank 耦合 
确定 联合 分 布 的 模型 。 


B 
解 : 设 X 的 边缘 分 布 参数 为 8,9， 则 Fi(%) = 1 - (二 1 - 








x+0 
X 到 ES 
(+ 过， 的 边缘 分 布 参数 为 y，r, 则 Fi(y) =1- (F757 =1- 
(1 + 二 ] ， 根 据 式 9. 4.3) ， 可 得 二 元 分 布 函数 ， 
eA A I-{l+y/T) 7 SE 
Me 


对 x* 和 y 求 偏 导 ， 得 到 联合 密度 函数 : 


(ae -1 )BYo OY x (L422/0) BH (1 +y/7) ina 
了 





fxr,r (x,7) 和 


fa-l+t[oe 8 1] 

对 斑 的 密度 函数 构造 极 大 似 然 郑 数 ， 利 用 样本 数据 估计 天 边缘 分 布 的 
参数 B68，9， 同 理 可 以 估计 y，r。 将 参数 估计 值 6，6, y, 7? 代入 联合 密度 
函数 的 极 大 似 然 隔 数 中 ， 则 可 以 根据 样本 数据 估计 参数 a， 并 进而 得 到 联 
合 密 度 旺 数 。 加 


9.4.3 ”和 模型 
和 模型 是 一 种 含 伴随 变量 的 参数 模型 。 它 将 总 危险 率 h(i |Z) 表示 成 基 
本 危险 率 h(t) 和 由 伴随 变量 引起 的 附加 危险 率 的 和 的 形式 。 假 设 第 j 个 伴 
随 变 量 在 时 刻 1 处 引起 的 附加 危险 率 可 以 表示 为 h(t|z) =h(t) :gg(zy)， 则 
可 得 到 : 
h(i|Z) = h(t) + by h(i)g,(z,) (9.4.8) 
特别 地 ， 有 g,(z,) =z, (对 于 所 有 的 j。 并 令 及 (1) =a,， 则 总 危险 率 模型 可 
简化 为 : 
hz|Z) = h(i) + Dy aj, (9.4.9) 
当 基 本 危险 率 为 一 常数 a, 时 ， 令 za =1， 就 可 以 得 到 总 危险 率 的 最 终 简 
化 形式 了 。 


h(ti|Z) = > G2, = CZ = Qo + a 二 GZ + QZ, (9.4.10) 


s 
i) 
j=0 
其 中 ， a’'= (gos 4,) ,也 =(zoz ,7 ,2,)', 且 z=1。 
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显然 ， 根 据 总 危险 率 的 最 终 简 化 形式 ， 总 危险 率 是 一 个 与 变量 瑟 无 关 
的 量 。 在 生存 模型 中 ， 如 果 生 存 函 数 服 从 指数 分 布 ， 在 常 值 死 力 假 设 下 ， 
总 危险 率 模 型 是 伴随 变量 z 的 线性 形式 ， 这 时 总 危险 率 模 型 的 最 终 简 化 形 
式 又 被 称 为 线性 指数 模型 。 

有 了 h(t|Z) 的 表达 式 ， 我 们 就 可 以 利用 极 大 似 然 估 计 法 来 估计 模型 
的 参数 。 考 虑 生存 模型 ， 设 观察 对 象 i 在 时 间 d 开始 进入 观察 ， 并 在 时 间 
离开 观察 ， 离 开 观 察 的 方式 有 退 保 或 死亡 。2, 是 指 第 i 个 对 象 的 所 有 伴随 
变量 z, ，zs，…，z 的 观测 值 向 量 。 那 么 根据 第 二 节 的 讨论 ， 第 i 个 对 象 对 
应 的 似 然 函 数 为 : 


f(z | 2,) 
1 ~-F(d|2.)’ 在 时 刻 死亡 
| =PCalZ) 
2 


由 式 (9.4.3) 知 ， 似 然 函数 可 以 表示 为 : 
_S(4|Z2)Th(s | 2.) 1 | 第 i 个 对 人 象 在 t, 时刻 死亡 


SCd | 2) 0， 第 i 个 对 象 在 时刻 退 保 
总 似 然 函数 为 : 
2 » S(z|2.,) 
态 渤 1I hl) SCa Tz) (9.4.11) 

S(E|2,) : es | 
其 中 ,302 2) = exp[-| ho|2)d0] = exp[ -| 0'Zido] = exp[ -02 
(z, —d,)] 
则 总 似 然 函 数 为 : 


L -= 本 [ac'Z,] exp[ — a’Z,(t, — d,)] 
对 其 求 对 数 : 
lInL = by lIn(a’Z,) 一 EAA 一 Ti) 


根据 极 大 似 然 估 计 原 理 2 上 -0， 得 到 





9a' 
0 d;) = 9.4.12 
Dn (9.4. ) 
这 里 a'Z,= (QQ 000) (Zo Za 922 2 ) 一 Go 十 GZ 十 CaZp 十 … + Qo 


这 里 我 们 需要 注意 ， 由 于 示人 性 隧 数 6, 的 存在 ， 能 够 得 到 的 方程 的 个 
数 万 待 佑 参数 的 个 数 s+1， 所 以 有 时 需要 使 用 数值 分 析 的 方法 得 到 参数 的 
估计 值 z,，2 ,… ,6,。 

【 例 9-28】 对 一 线性 指数 模型 ,第 i 个 观察 对 象 的 危险 率 函 数 为 
h(t|z) =wza +0szz， 其 中 避 为 第 i 个 对 象 的 第 j 个 伴随 变量 的 观测 值 ，a， 
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a; 为 参数 。 所 有 的 对 象 均 由 上 =0 开始 观察 。 已 知 表 9 -9 中 包含 4 人 组 成 的 
样本 的 数据 ， 求 a, ，a, 的 极 大 似 然 估计 值 。 


表 9 -9 例 9-27 的 观察 数据 





观察 对 象 i 














解 : 因为 所 有 的 对 象 均 由 t=0 开始 观察 ， 所 以 对 于 所 有 的 i,. r; = 0。 
又 根据 各 个 对 象 退 出 观察 的 方式 ， 知 道 5 =5, =1, 6, =6,=0。 
QQD =awizil + 02 =20 + a, 
Q DBF =az +Q22 二 QI 十 Ga 
CD =az + Qs23 =4a, + 4a, 


? 一 — 
xD =aiz +az = 8a +8a, 





" Bz n 
将 已 知 数 据 代 入 2, a D, zal ti — 7) =0 





亿 
对 于 j=1， 
之 1 ， 
于 -~-[2xl+1x2+4x3+8x5]=0 (9.4.13) 
2a +a, al+a, 
对 于 7=2， 
L 1  _rlixl+lx2+4x3+8x5l-=0 (9.4. 14) 








十 
2a, +a, al 十 aa 


整理 式 (9.4.13) 和 (9.4. 14) : 


2a, +a,=1 
和 54 
人 
人 
第 ii 个 观察 对 象 的 危险 率 函 数 为 : 
53 52 
h(tz | 2,) 54 一 54 
生存 旺 数 为 : 
S(1;2Z,) = expf[ 一 [Cw | 2Z,)dw ] = exp| 332ut 一 2 | 
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9.4.4 积 模型 
积 模型 就 是 将 总 危险 率 由 基本 危险 率 h(t) 与 由 伴随 变量 产生 的 附加 危 
险 率 相 乘 得 和 到。 其 中 最 常用 的 模型 是 Cox 模型 (也 称 比 例 风 险 模 型 ) 。 已 知 
基本 危险 率 为 h(t)， 伴 随 变 量 为 %，z,，…,z，Cox 模型 就 是 : 
h(z|2Z) =h(t)c(az, +az + +a,z,) =h (it)c(a'Z) (9.4.15) 
其 中 c(7) 为 自 变 量 的 定义 束 为 正 数 的 任意 函数 ，a = (4, 4,… ,a,)， 
pA 


一 般 情况 下 ，Cox 模型 指 ce(y) =e 的 情况 。 则 Cox 模型 的 基本 结构 是 : 


h(i|Z) = h(t)exp (六 Qj2) = h(t)e"” (9.4.16) 
按照 Cox 模型 的 形式 ， 易 知 构建 cox 模型 需要 满足 如 下 条 件 : 
1. 比例 风险 假定 (PH 假定 ，proportional hazards) 。 任 两 个 个 体 危 险 率 
郴 数 之 比 不 随时 间 改 变 。 即 


h(t) | | a 
0 a 


2. 对 数 线 性 假定 。 任 一 个 体 i 的 危险 率 晴 数 的 对 数 与 伴随 变量 Z, 呈 线 
性 关系 。 即 
lnh,(#) -lnh (1) =a 
在 生存 模型 中 ， 在 常 值 死 力 假设 下 ，h,(i) =e”*， 则 可 以 得 到 最 终 简化 
模型 : 





h(t|2Z) = exp ( 2, az) = ee (9.4.17) 
其 中 Qa’'= (ao ， ai ,0,), Z= Cag 人 目 .2E Lo 若 生 存 模 型 服 
从 指数 分 布 ， 则 cox 模型 下 的 总 危险 率 模型 又 被 称 为 “对 数 线性 指数 模 
型 ”。 
在 常 值 死 力 假设 下 由 式 (9. 4.11) 


-I » S(t | 2.,) 
L= 1I [有 (| 2,)] SCa [2.) 
其 中 ， h(iz,| 2.,) = e?2， 
S(t;2,) 和 s 
SC2Z 到 exp| -| 2o12)ado| = exp| -| do | 
时 exp[ — ez, — d.)] 


则 总 似 然 函 数 
LL 二 [I [e’”“]*exp[ — e’“(#,—d,)] 
对 其 求 对 数 得 : 
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lInL= > 6.(a’Z,) — e" (下 -4d,) 
iml i=1 


1 
信人 0 要 到 | 
oda, 


> 6,z) 一 了 2(6-dad)e” =0 (9.4.18) 


求解 关于 a, 的 方程 组 ,我们 就 可 以 得 到 参数 的 估计 值 4。，4,，…， 
a, 了 。 

【 例 9-29】 对 一 个 肝癌 患者 群体 ， 其 生存 函数 与 被 观察 对 象 的 起 始 
年 龄 、 是 否 醒酒 及 自 起 始 年 龄 开始 的 时 间 有 关 ， 假 设 对 数 线性 指数 生存 模 
型 为 适宜 模型 。 设 z 为 被 观察 对 象 的 起 始 年 龄 ，z, 为 表示 是 否 柄 酒 的 示人 性 
函数 , za =1 表示 柄 酒 ; 对 一 个 由 6 个 病人 组 成 的 样本 ,由 t=0 开始 观察 。 
表 9 -10 给 出 了 z 和 za 的 值 ， 以 及 死亡 观察 对 象 退出 观察 的 时 间 和 方式 ， 
确定 可 以 求解 ，2 ，2. 的 方程 。 





表 9 -10 例 9-28 中 的 观察 数据 
i (病人 ) z1 2 死亡 时 间 观察 终止 时 的 生存 时 间 
1 S51 1 5.0 一 
此 32 0 4.5 
3 加 53 0 一 3.0 
4 55 1 8.0 
5 60 1 一 7.0 
6 61 0 6.0 

















解 : 因为 所 有 的 对 象 均 由 上 =0 开始 观察 ， 所 以 对 于 所 有 的 i, d,=0。 
根据 各 个 对 象 退出 观察 的 方式 ， 知 道 6, =6, =66=1, 6,=6,=6,=0。 


QQ =a +TSlc +a,, a’'Z, = ao +52a, 

a'Z, =a, +53a,, a'Z,=a0 +55a, +a, 
’ a a 

a'Z; =a, +60a,+4a,, a'Z, = au +6la, 


对 于 7 = 0， > iz, 一 > z(ti -di)e”” = 0 可 化 为 : 
3 [Se ts 44, Se 4 36ers 4 Be Ie 4 60" ] -0 
对 于 j=1， 得 到 : 
51 +55 +61— (S51 xSe”"’™"” +52 Xx4. Se +53 x3e"'™ 
+55 x8e”’”"'" +60 x7e +61 x6e”"'"")=0 
对 于 7=2， 得 到 : 


Ds (Se + Se 下 =0 
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【 例 9 -30】 假设 机 动车 辆 险 的 索赔 额 依赖 于 车 辆 的 价值 和 车 辆 的 使 
用 性 质 (营运 或 非 营 运 )， 假设 基本 危险 率 服从 指数 分 布 ， 分 别 建立 比例 
风险 模型 。 

解 : 设 代表 车 辆 的 价值 ， 显 然 a 的 取 值 为 非 负 ; a, 代表 车 辆 的 使 用 
性 质 ; z, =1 代表 营运 车 ，z, =0 代表 非 营 运 的 车 。 则 任意 一 个 车 辆 的 危险 
率 函 数 形 式 为 : 

h(x|Z) =h, (xz) ef 人 
考虑 两 个 价值 均 为 a 的 营运 车 和 非 营 运 车 ， 危 险 率 函数 之 间 存 在 如 下 关系 : 
hsa (Xx) = h(x)e'® 一 万 和 过 (X) ee 
根据 生存 函数 和 和 危险 率 函 数 之 间 的 关系 ， 可 以 得 到 两 个 车 辆 的 生存 画 数 之 
间 的 关系 : 


Saa(X) = exp[-f hse (7y) dy | 三 exp[ -人 has(y)eedy | 


= SC 

基本 危险 率 可 以 使 用 参数 模型 或 者 样本 数据 来 估计 ， 然 后 使 用 极 大 似 
然 估 计 方 法 估计 B6,，pB;。 

为 了 构造 极 大 似 然 函数 ， 我 们 需要 求 出 生存 函数 和 密度 函数 。 令 cj = 
exp〈B"z) 表 示 第 7 个 观测 的 cox 乘 数 ， 则 S,(x) = S,《(x)"， 其 中 S,(x) 是 基 
本 危险 率 对 应 的 生存 函数 。 密 度 函 数 为 : 

3S (xz) 四 有 
f(x)= 一 = -cS (x)" (So (x))'=c,S, (x)” f(x) 


对 于 基 木 危险 率 服从 指数 分 布 的 情况 ， 有 





et 
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和 模型 和 积 模型 要 求生 存 函 数 之 间 具 有 特殊 的 关系 。 从 精算 的 角度 来 
说 ， 这 可 能 不 是 最 合理 的 ， 因 为 很 难 解释 危险 率 函 数 乘 以 一 个 常数 的 含义 ， 
或 对 生存 旺 数 求 究 的 意义 。 考 虑 将 变量 与 我 们 关心 的 量 例如 期 望 值 直 接 建 
立 关 系 ， 可 能 更 加 有 意义 。 常 用 的 方法 是 回归 分 析 法 。 

回归 分 析 是 研究 一 个 变量 关于 另 一 个 〈 些 ) 变量 的 依赖 关系 的 计算 方 
法 和 理论 ， 其 目的 在 于 用 后 者 的 已 知 或 设 定 值 ， 去 估计 (预测 ) 前 者 的 
(总 体 ) 均值 。 较 为 广泛 使 用 的 回归 模型 是 古典 线性 回归 模型 ,但 是 由 于 
精算 问题 中 所 采用 数据 的 特殊 性 ， 无 法 满足 古典 线性 回归 模型 的 假设 ， 因 
此 近 些 年 来 ， 广义 线 性 回归 模型 (generalized linear models，GLM) 在 精算 
中 迅速 得 到 应 用 。 

1. 古典 线性 回归 模型 。 在 介绍 广义 线性 回归 模型 之 前 ， 先 来 回顾 一 下 
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古典 线性 回归 模型 的 知识 。 模 型 形式 为 : 

Y=B, +Bx: t+tBx + +B,.x,. +e 
其 中 了 表示 被 解释 变量 ( 因 变 量 ) ，x 表示 解释 变量 ( 自 变量 ),， se 是 随机 误 
差 ，B, 为 未 知 参 数 ， 称 为 回归 系数 。 在 古典 线性 回归 模型 假定 : 

第 一 ， 解 释 变量 x, ，x,，…，x, 是 非 随 机 变量 ,线性 无 关 ; 

第 二 ， 独 立正 态 性 假定 : ze,|x ~N(0, oo), Cov (&,， 2; | x) =0, ij。 

根据 模型 的 假定 ， 可 知 古 典 线 性 回归 模型 具有 如 下 特征 : 

(1) E(Y) =x’B=B, +Bx, +B,x, + +B,x,; 

(2) x、 了 都 是 取 连 续 值 的 变量 ， 如 农作物 的 产量 ， 人 的 身高 体重 
之 类 ; 

(3) 了 的 分 布 为 正 态 ， 或 接近 正 态 之 分 布 。 

尽管 古典 回归 分 析 在 经 济 、 金 融 中 得 到 了 大 量 应 用 ， 但 是 由 于 保险 数 
据 的 特点 ， 上 古典 回归 分 析 在 用 于 处 理 保 险 数 据 时 存在 一 定 的 缺陷 ， 主 要 体 
现 为 : | 

首先 ， 上 古典 线性 回归 模型 要 求 随机 误差 项 ， 进 而 因 变 量 服 从 正 态 分 布 。 
但 在 保险 数据 中 ， 这 一 假设 常常 不 能 保证 ， 尤 其 是 非 寿 险 的 损失 分 布 ， 通 
常 具有 不 对 称 、 定 义 域 非 负 并 且 尾 部 较 厚 的 特点 ， 此 时 使 用 正 态 分 布 的 假 
设 就 不 太 合 适 了 。 

其 次 ,古典 线性 回归 模型 假设 误差 项 同方 差 ， 从 而 因 变 量 的 方差 也 为 
常数 。 但 是 ， 精算 问题 中 这 一 假设 常常 会 遭 到 破坏 ,例如 当 赔 付 额 越 大 时 ， 
其 误差 也 应 该 越 大 才 合 理 ， 即 方差 应 该 随 均 值 的 改变 而 发 生变 化 ， 所 以 要 
求 同 方差 的 假定 不 现实 。 

再 次 ， 换 失事 件 发 生 的 概率 是 0 和 1 之 间 的 数 ， 若 将 此 变量 作为 因 变 
量 ， 简 单 地 将 概率 表示 为 解释 变量 的 线性 组 合 是 不 合理 的 ， 因 为 线性 组 合 
的 取 值 范围 并 不 局 限于 (0，1) 。 

最 后 ， 古 典 线性 回归 模型 要 求 用 解释 变量 的 线性 表达 式 来 解释 被 解释 
变量 ， 但 有 时 这 种 解释 关系 可 能 是 乘法 关系 。 

2. 指数 分 布 旋 。 广 义 线性 模型 将 被 解释 变量 服从 正 态 分 布 的 假定 推广 

到 服从 指数 分 布 族 。 因 此 我 们 首先 来 了 解 一 下 指数 型 分 布 族 ， 其 概率 密度 
函数 可 以 表示 为 : 
"0 + ely.,8) | (9. 4. 19) 
其 中 a(- ),b5(…),c( : ) 为 已 知 画 数 ， 它 们 对 所 有 的 观测 值 形 式 相 同 。 
a( -) 的 形式 通常 为 / 问 ， 其 中 心 是 先 验 权重 ; 函数 上 ) 称 为 “累积 晒 
数 ”，6, 称 为 “自然 参数 ”， 其 取 值 与 均值 有 关 ; 中 称 为 “离散 参数 ”， 与 
方差 有 关 。 


f(yi;0.,$) = exp | 
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根据 密度 函数 的 性 质 ， 易 知 有 如 下 等 式 存在 : 
|_ fy30,8) dy 却 册 . 竺 fh ¢xp 人 + ce0O 和 ) ar 


-= a( 中 ) 

设 j;=E(Y,)， 则 对 上 式 求 9, 的 一 阶 二 阶 三 阶 导 数 ， 得 到 如 下 结果 : 
E(Y.) = =6"(0.,) (9. 4. 20) 
Var(¥.) =a($)b (0.,) (9. 4. 21) 
E[(Y,-1)’] =a ($4)b (0.) (9. 4. 22) 


由 上 述 结 果 可 以 得 到 如 下 性 质 和 结论 : 

(1) 指数 型 分 布 族 的 均值 w: 由 自然 参数 9, 唯一 确定 。 车 函数 58'(，* ) 存 
在 逆 函 数 ， 则 可 得 0; =2 (Am) 。 

(2) 指数 型 分 布 的 方差 是 两 个 函数 的 乘积 ， 一 个 是 关于 自然 参数 0 的 
画 数 6"(9,) ， 如 (1) 所 述 ， 也 是 均值 w; 的 函数 ， 被 称 为 “方差 消 数 ”; 另 一 
个 是 关于 离散 参数 由 的 函数 wa($) ， 与 自然 参数 和 均值 无 关 。 如 果 将 方差 函 


Vl 
数 表 示 成 均值 的 函数 ， 记 为 VC)， 则 有 Var(Y) -2 其 中 V(j.) 为 


方差 水 数 ; 4 为 离散 参数 ,将 方差 进行 了 缩放 ; w, 表示 第 i 个 观察 值 的 
权重 。 

指数 分 布 族 包含 了 许多 常见 分 布 ， 例 如 正 态 分 布 、 二 项 分 布 等 等 。 表 
9 -11 列 出 了 几 种 常见 的 指数 分 布 族 的 参数 形式 。 





表 9 -11 指数 分 布 族 中 的 常见 分 布 
分 布 a( 4) b( 0) cC7， 中 ) 

正 态 分 布 $b/w 9/2 -0.5 [wy’/$+ln (27$/w)] 
泊 松 分 布 b/w exp (9) -ln (x!) 
二 项 分 布 (试验 m m 

b/w m* ln [1 +exp (6)] "|( ) 
次 ) 7 

wf ©. 

伯 玛 分 布 do -ln( -6) | | In(y) [rr 人 )] 
逆 高 斯 分 布 $/w ~ VV-20 -0.5 [ln (2rdy w+w/ (by)] 











3. 广义 线性 模型 。 广 义 线性 模型 从 以 下 几 个 方面 对 古典 线性 模型 进行 
了 推广 : 

(1) E(Y) =j=g"(x'B) (注意 古典 线性 回归 模型 为 E(Y) = = x%'B)， 
8 为 一 严格 单调 、 充 分 光滑 的 函数 ， 称 为 “联结 函数 ”。 联 结 函 数 的 反 函 数 
称 为 “均值 函数 ”。 记 n=g(1) =x'B。 

(2) x, 了 可取 连续 或 离散 值 ， 且 在 应 用 上 更 多 见 的 情况 为 离散 值 ， 如 
{0, 1} ，{0, 1，-…，%|} 等 。 
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(3) 了 的 分 布 属于 指数 型 分 布 族 ， 正 态 分 布 是 其 一 特例 。a( 9) 的 选取 
与 y 的 分 布 有 关 。 

由 此 看 出 ， 广 义 线性 模型 是 由 三 部 分 构成 的 : 随机 成 分 、 系 统 成 分 、 
联结 哨 数 。 

。 随机 成 分 ， 因 变量 了 或 误差 项 的 概率 分 布 。 与 古典 线性 回归 模型 中 
假设 因 变量 的 每 个 观察 值 相互 独立 服从 正 态 分 布 不 同 ,广义 线性 模型 假设 
因 变 量 的 每 个 观察 值 相互 独立 且 服 从 指数 型 分 布 族 中 的 一 个 分 布 。 

。 系统 成 分 ， 即 解释 变量 的 线性 组 合 ， 表 示 为 mi = x'B = Bixs + 
Bro 十 +B,xi,o 

。 联结 函数 ， 联 结 函 数 建立 了 随机 成 分 与 系统 成 分 之 间 的 关系 。 与 古 
典 线 性 回归 模型 中 将 因 变 量 工 的 期 望 值 直接 等 于 解释 变量 的 线性 组 合 不 同 ， 
广义 线性 模型 将 因 变 晤 工 的 期 望 值 表示 成 解释 变量 线性 组 合 的 函数 变换 ， 
这 个 变换 就 利用 到 了 联结 晒 数 。 虽 然 不 同 的 观测 值 可 以 有 不 同 的 联结 哨 数 ， 
但 是 实际 应 用 中 通常 对 所 有 的 观测 值 使 用 相同 的 联结 蚂 数 。 














表 9 -12 常见 的 联结 函数 
联结 函数 名 称 Bpi) = 人 Hi=E (ni) 
恒 等 Hi 了 
对 数 ln (pi) exp (7:) 
倒数 pi | wl ee 
Logit ln [pt (1 -pi)] 1/ [1+exp (—”i)] 








显然 ， 古 典 线性 回归 模型 就 是 广义 线性 模型 联结 函数 取 恒 等 形式 ， 因 
变量 来 自 于 正 态 分 布 的 特例 。 

在 广义 线性 模型 中 ， 因 变量 来 自 指数 分 布 族 ， 所 以 方差 函数 可 以 表示 
成 均值 的 画 数 ， 这 一 特性 非常 适合 保险 数据 ， 这 也 是 广义 线性 模型 在 费 率 
厘定 等 精算 问题 中 应 用 广泛 的 原因 之 一 。 

一 般 地 ， 广义 线性 模型 中 因 变 量 分 布 形 式 的 确定 主要 依靠 保险 数据 的 
先 验 信息 ， 其 主要 根据 就 是 因 变 量 的 方差 与 均值 的 关系 。 例 如 ， 如 果 因 变 
量 的 方差 为 常数 ， 则 可 以 选择 正 态 分 布 ; 如 果 因 变量 的 方差 等 于 均值 ， 则 
可 以 选择 泊 松 分 布 ; 如 果 因 变量 的 方差 等 于 均值 的 平方 ， 则 可 以 选择 件 玛 
分 布 ; 如 果 因 变量 的 方差 等 于 其 均值 的 三 次 方 ， 可 以 选择 逆 高 斯 分 布 。 

根据 保险 数据 自身 的 特点 ， 我 们 在 估计 不 同 的 因 变 量 时 ， 常 使 用 一 些 
典型 的 广义 线性 模型 : 

(1) 在 估计 索赔 次 数 或 索赔 频率 时 ， 典 型 的 广义 线性 模型 是 泊 松 乘法 
模型 ， 即 使 用 对 数 联结 郴 数 和 泊 松 分 布 的 误差 项 。 在 估计 索赔 次 数 时 ， 通 
常用 风险 单位 数 加 权 。 在 例 9 -31 中 ， 我 们 将 看 到 如 何 利 用 泊 松 乘法 模型 
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来 估计 索赔 次 数 。 
(2) 在 估计 索赔 强度 时 ， 一 般 使 用 人 玛 乘法 模型 ， 即 使 用 对 数 联结 函 
数 和 伽 玛 分 布 的 误差 项 。 


(3) 在 估计 续 保 率 和 新 业务 转换 率 时 ， 常 使 用 Logistic 模型 ， 即 采用 
Logit 联结 函数 和 二 项 分 布 的 误差 项 。 该 模型 在 因 变 量 的 取 值 很 小 时 ， 可 以 
用 泊 松 乘法 广义 线性 模型 近似 。 

与 吉 典 线性 回归 模型 类 似 ， 广 义 线 性 模型 中 的 参数 估计 也 可 采用 极 大 
似 然 估计 的 方法 。 下 面 用 一 个 例子 来 说 明 广 义 线性 模型 的 求解 及 在 精算 中 
的 应 用 。 

【 例 9-31】 设 汽 车 保险 的 风险 分 类 系统 包括 两 个 变量 : 行驶 区 域 和 
加 驻 员 性 别 。 行 驶 区 域 的 取 值 为 城市 和 乡村 两 个 水 平 ， 驾 驶 员 性 别 的 取 值 
为 男 和 女 两 个 水 平 。 假 设 实际 
观察 的 保单 组 索赔 次 数 如 表 9 - 
13 所 示 ， 分 别 建立 古典 线性 回 
归 模 型 和 广义 线性 模型 将 索赔 
次 数 表 示 成 行驶 区 域 和 人 性别 的 
线性 组 合 。 

解 : 设 索 赔 次 数 为 Y， 男 性 为 x,、 女 性 为 x,、 城 市 为 x,、 乡 村 为 x,， 并 
且 这 四 个 变量 的 取 值 只 能 为 0 或 1， 那么 对 于 男性 驾驶 员 ,x, =1、x, =0， 
对 于 女性 驾驶 员 x, =0，x, =1， 对 于 行驶 在 城市 的 车 辆 x,=1，%, =0， 对 于 
行驶 在 乡村 的 车 辆 x, =0，x, =1。 

(1) 上 古典 线性 回归 模型 。 因 为 x, +x, +x +x =2， 解 释 变 量 之 间 存 在 
多 重 共 线性 ， 所 以 去 掉 一 个 解释 变量 *x,， 建 立 古 典 线性 回归 模型 : 

Y=Bx, +B,x, +Bxs+é 
按照 最 小 二 乘法 得 到 参数 估计 值 为 : 
B, =2 625，B, =875, B, =1 250 
则 模型 为 了 =2 625x + 875x, + 1 250x,。 
根据 参数 估计 值 ， 可 得 索赔 次 数 的 拟 合 值 如 表 9 -14 所 示 。 


表 9 -13 索赔 次 数 的 观察 值 








(2) 广义 线性 模型 。 将 风 表 9 -14 ”索赔 次 数 的 拟 合 值 : 
险 分 为 男性 城市 、 男 性 乡村 、 古典 线性 回归 模型 
女性 城市 、 女 性 乡村 4 个 类 别 。 本 乡村 
设 索 赔 次 数 为 了 Y， 男 性 为 x,、 女 家 ee 


性 为 x,、 城 市 为 x,、 乡 村 为 x,， 
并 且 四 个 解释 变量 的 取 值 只 能 中 
为 0 或 1。 为 了 避免 多 重 共 线 
性 ,剔除 zx, ， 则 各 个 类 别 的 期 望 索赔 次 数 可 以 表示 为 : 
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信 ; =g "(Bixa + Bxa + Bs,xa) 


索赔 次 数 服从 泊 松 分 布 ， 则 有 f(y;1) = 和 ce， 似 然 函 数 为 : 


y! 
a aT 
L= Tf sp) 2 Hl | 
对 似 然 函数 求 对 数 得 : 
i = ln FAC7i AD) >, L yln (Cp,) Es ln(y.!) — ei] (9.4. 23) 


选用 对 数 联 结 函数 ， 则 有 内 = exp (Bixa +B:xa +Bsxa)， 即 
Ai exp〈B, +B,) 
Lz exp (B,) 
四 (9.4.24) 
As exp (B, + ) 
Ka exp (B,) 
将 观察 值 y, 和 式 (9.4.24) 代入 式 (9.4.23) 中 ， 得 到 似 然 函 数 的 对 
数 为 : 
l=[4 000(B, +B;) -ln4 000! ~ exp (B, +B,)] + 
[2 5008, -In 2 5001 -exp(B,)]+[2000(6, +B;) — 
ln 2 000! ~ exp (B, +B,)] + [1 0008,—1n 1 000! -exp (B,)] 
0l al ol 

















i 则 有 
=4 000 ~ exp (B, +B;) +2 500 ~ exp (BB) =0 
6 =2 000 -exp (B, +D) +1 000 -exp (B:) =0 
8 =4 000 -exp (B, +B,) +2 000 -exp (B, +B;) =0 


9-1s 器 菩 次 合 a } 
解 上 述 方程 组 可 得 参数 估计 值 为 人 





0.539。 根 据 参 数 估计 值 ， 可 得 ee | 城市 乡村 
索赔 次 数 的 拟 合 值 如 表 9 - 15 男 4 105.2 2 394.7 
Ly 女 1 894.7 1 105.2 
所 示 。 
国 
习 题 


1. 已 知 索 赔 额 分 布 服从 佑 玛 分 布 ， 随 机 的 10 个 索赔 额 样 本 : 1 500、 
6 000、3 500、3 800、1 800、5 500、4 800、4 200、3 900、3 000， 试 用 适 
舍 计 法 估计 参数 Qa 和 6。 
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2. 假设 索赔 额 分 布 为 帕 累 托 分 布 ， 随 机 20 个 索赔 额 样本 为 : 27、82、 
115、126、155、161、243、294、340、384、457、680、855、877、974、 
1 193、1 340、1 884、2 558、15 743。 计 算 适 估计 套数 。 

3. 不 是 密度 为 Kx) =pxz "(0 <x<1) 的 连续 随机 变量 ,一 组 随机 样本 
的 三 次 观测 为 0.2、0.3、0.5。 找 出 极 大 似 然 估计 的 p。 

4. 运用 中 位 数 估 计 法 对 习题 2 中 的 数据 进行 参数 估计 ,假设 分 布 为 指 

5. 一 组 分 组 数据 具有 如 下 性 质 : 

(0,5] -mn =2,(5,10] ~n, =2,(10,25] -nm =2,(25,% ] -mn =2 
运用 极 大 似 然 估计 方法 估计 下 面 分 布 的 参数 : (1) 参数 为 9 的 指数 分 布 ; 
(2) (0，6) 上 的 均匀 分 布 。 

6. 以 下 是 对 于 限额 为 20 的 保单 的 10 次 赔付 额 : 3、5、6、8、9、13、 
16、20、20、20 (三 个 20 均 为 赔偿 限额 ， 所 以 这 三 次 的 振 失 额 都 大 可 
20) 。 假 设 损失 人 额 服从 [0, 96] 的 均匀 分 布 。 运 用 纸 估 计 方 法 估计 0。 

7. 对 于 10 个 有 免 赔 额 5 的 保单 赔付 额 : 4、5、6、6、9、14、16、18、 
22、25。 人 假设 损失 人 额 服 从 以 下 几 种 分 布 、 运 用 绑 估 计 参 数 9: (1) [0, 6] 
上 的 均匀 分 布 ; (2) 参数 为 9 的 指数 分 布 ; (3) 帕 累 托 分 布 ， 参 数 为 9 和 
Q =2。 

8. 下 面 是 一 组 赔偿 限额 为 50 的 某 险 种 保单 赔付 额 : 3、4、8、10、12、 
18、22、35、50、50、50、50。 如 果 损 失 额 下 服从 指数 分 布 ， 运 用 极 大 似 
然 估 计 方 法 估计 参数 。 

9. 对 于 第 8 题 ， 假设 四 服从 (0，6) 上 的 均 习 分 布 ， 运 用 极 大 似 然 估 
计 方 法 估计 参数 。 

10. 假设 某 类 保单 的 免 赔 额 为 5， 随 机 抽取 了 8 张 保单 的 理赔 额 如 下 : 
3、4、8、10、12、18、22、35。 假 设 损失 额 服 从 以 下 两 种 分 布 ， 运 用 极 大 
似 然 估计 方法 估计 参数 : (1) 指数 分 布 ; (2) (0，6) 上 的 均匀 分 布 。 

11. 假设 对 服从 帕 累 托 分 布 ， 参数 9=10， 随机 抽取 了 8 个 样本 : 3、 
4、8、10、12、18、22、35。 求 参数 a 的 极 大 似 然 估计 以 及 P(X<10) 的 极 
大 似 然 估计 。 

12. 已 知 某 类 保单 的 免 赔 额 4d =2， 赔 偿 限 额 为 w=16， 随机 抽取 了 8 次 
的 赔付 额 观测 值 为 : 1、2、6、8、10、14、14、14。 假设 初 始 损 失 额 分 布 
为 参数 为 96 的 指数 分 布 ， 求 9 的 极 大 似 然 估计 。 

13. 一 组 免 赔 额 为 5 的 保单 赔付 样本 为 : 6、7、7、9、11、17、21、 
34。 假 设 初始 损失 额 服 从 指数 分 布 ,， 求 参数 98 的 极 大 似 然 估计 。 


7 ,~ (x/0)7 
14. 已 知 随机 变量 站 服从 书 伯 分 布 ， 密 度 函 数 为 (zx) = 全 0 一， 


随机 抽取 8 个 祥 本 : 3、4、8、10、12、18、22、35。 已 知 参 数 了 T=0.374， 
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求 9 的 极 大 似 然 估计 以 及 PP (对 <10) 的 极 大 似 然 估计 。 

15. 假设 站 是 服从 套数 8 的 指数 分 布 ，12 个 随机 样本 为 : 7、12、15、 
19、26、27、29、29、30、33、38、53。 求 6 的 极 大 似 然 估 计 和 570) 。 

16. 运用 第 15 题 的 数据 ， 求 rar(X) 的 估计 的 方差 。 

17. 利用 第 15 题 的 数据 ,计算 P[ 和 >10] 的 置信 和 度 为 95% 的 置信 区 间 。 

18. 随机 变量 站 的 12 个 样本 点 为 : 7、12、15、19、26、27、29、29、 
30、33、38、53。 假 设 下 服从 指数 分 布 ， 求 参数 估计 的 方差 的 极 大 似 然 
估计 。 

19. 求 第 18 题 中 的 方差 的 极 大 似 然 估计 ， 求 方差 估计 值 的 95% 的 置信 
区 间 。 
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-学习 目标 
口 了 解 选择 最 优 模 型 的 方法 
口 学 会 运用 p -p 图 、Q -Q 图 和 平均 剩余 生命 图 等 图 形 来 直观 选择 合 
适 的 分 布 
口 掌握 刀 拟 合 优 度 检验 、K -S 检验 、Anderson - Darling 检验 和 似 然 
比 检验 等 选择 比较 分 布 


§10.1 引 襄 


在 建 模 过 程 的 最 后 阶段 ， 我 们 需要 从 众多 的 备 选 模型 中 选择 一 个 “最 
优 ” 模 型 。 这 里 的 “最 优 ” 定义 取决 于 具体 的 应 用 ,依赖 于 对 所 研究 的 问 
题 的 了 解 。 实 际 上 我 们 要 从 模型 的 使 用 条 件 、 拟 合 程度 和 使 用 的 局 限 性 等 
答 个 方面 米 对 雇 窗 特 选 异型 进行 从 驼 和 策 选 。 

我 们 知道 ， 图 像 是 显示 差异 的 最 简单 、- 直观 的 方法 。 因 此 在 对 比 数据 
和 模型 时 ， 图 像 的 比较 是 最 方便 快捷 的 途径 。 但 是 ， 图 像 并 不 总 是 可 靠 的 ， 
特别 是 在 备 选 模型 的 分 布 函数 与 数据 经 验 分 布 函数 比较 接近 时 ， 很 难 从 图 
像 上 分 辨 出 细微 的 差距 。 此 时 ， 统 计 学 假设 检验 的 方法 可 以 更 有 逻辑 地 显 
示 出 不 同 模型 间 的 拟 合 程度 差异 。 构 造 的 检验 统计 量 往往 是 对 模型 的 分 布 
函数 和 经 验 分 布 耻 数 之 间接 近 程 度 的 一 个 度量 。 最 后 ， 图 像 比 较 和 假设 检 
验 的 结果 可 以 引导 我 们 进行 模型 的 合理 选择 ， 确 定 “ 最 优 ” 的 拟 合 模型 。 
但 是 ， 无 论 选 择 哪 个 模型 ， 都 是 对 实际 情况 的 一 种 近似 。 所 有 的 模型 都 存 
在 一 定 的 问题 ， 并 不 存在 绝对 最 优 的 模型 。 不 过 ， 我 们 选择 的 “最 优 ” 模 
型 还 是 可 以 在 一 定 程 度 上 使 用 ， 得 到 的 最 终结 论 也 有 意义 。 

一 般 来 说 ， 对 模型 的 筛选 将 经 历 如 下 的 过 程 : 

。 被 选 模型 与 实际 数据 图 形 上 的 直观 比较 和 筛选 ; 

。 用 统计 学 方法 对 模型 分 布尔 数 与 经 验 分 布 函 数 进行 检验 (如 x 拟 合 
优 度 检验 、K - s 检验 、Anderson - Darling 检验 等 ) ; 

。 由 一 定 的 标准 进行 模型 选择 〈 和 常用 主观 判断 法 和 评分 法 ) 。 

本 章 中 ， 我 们 将 讨论 模型 评估 的 几 种 方法 ， 进 而 总 结 出 一 个 特定 的 建 
模 策 略 ， 可 以 适用 于 大 多 数 情 形 下 的 模型 选择 。 需 要 注意 的 是 ， 每 种 方法 
都 有 自身 的 优势 和 劣势 ， 选 择 不 同 的 方法 ， 可 能 得 到 不 同 的 模型 。 因 此 ， 
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模型 筛选 在 作为 一 门 知识 的 同时 也 是 一 种 艺术 。 


$10.2 模型 的 直观 选择 


10.2.1 数据 与 模型 的 表示 


模型 是 对 数据 分 布 规律 的 展示 。 模 型 通常 可 以 通过 密度 函数 和 分 布 函 
数 来 表示 ， 或 者 是 由 其 决定 的 函数 ， 例 如 平均 剩余 寿命 函数 或 者 带 上 限 的 
期 望 值 函数 。 数 据 通常 用 经 验 分 布 函数 或 者 直方 图 来 表示 ， 其 中 经 验 分 布 
函数 用 于 表示 个 体 数据 ， 而 直方 图 常用 于 表示 分 组 数据 。 对 于 个 体 完整 数 
据 ， 这 些 经 验 图 形 是 很 容易 得 到 的 。 但 是 对 于 分 组 数据 、 截 断 数据 和 删 失 
数据 来 说 ， 会 有 一 定 的 难度 。 对 于 离散 模型 ， 很 少 存在 删 失 、 截 断 以 及 分 
组 的 情况 ， 数 据 可 以 由 每 个 观测 点 处 的 相对 频率 和 累积 频率 来 表示 。 

本 章 中 只 讨论 在 同一 点 截断 或 删 失 数据 。 假 设 数 据 集 的 截断 点 是 :， 则 
经 验 分 布 的 起 始点 也 是 :。 为 了 和 经 验 值 进 行 比较 ,我 们 使 用 的 模型 必须 是 
截断 的 。 因 此 ， 截 断后 的 模型 表示 为 : 

0 ， x<d 0 x<d 


F(x)=|F (x)-F (qd) oC 
1_F(d) ? ”7 1-F (da)? 


其 中 F(x) 、Ax) 表 示 没 有 截断 的 模型 。 

本 章 中 ， 如 果 分 布 函数 或 密度 函数 的 下 标 为 样本 容量 ， 则 表示 它 是 经 
验 模 型 下 的 分 布 函数 或 密度 函数 ， 如 Ff,(x); 如 果 没 有 标记 或 者 用 (* ) 
标注 ， 则 表示 为 估计 的 参数 模型 。 


x 宇 d 


10.2.2 密度 函数 与 分 布 函 数 的 图 像 比较 

对 模型 拟 合 程度 最 直接 的 检验 方法 是 做 图 。 我 们 一 般 选 用 经 验 分 布 图 
( 卵 形 图 ) 、 直 方 图 、 核 密度 图 等 与 备 选 模型 的 分 布 郑 数 或 密度 函数 图 进行 
比较 。 当 模型 与 样本 的 分 布 图 像 比较 接近 时 ， 我 们 认为 可 以 使 用 该 函数 拟 
合 样 本 数据 。 如 果 差异 较 大 ， 超 出 了 可 以 接受 的 范围 ， 则 认为 不 能 使 用 该 
函数 进行 拟 合 。 下 面 用 几 个 例子 说 明 图 像 比较 法 的 具体 应 用 。 

【 例 10 -1】 由 10 只 试验 老鼠 组 成 的 样本 ， 其 死亡 时 间 (以 天 为 单 
位 ) 为 : 3、4、5、7、7、8、10、10、10、12。 假定 适合 的 生存 模型 为 指 
数 分 布 ， 试 用 极 大 似 然 估计 指数 分 布 参 数 ， 并 用 图 像 对 比 法 进行 模型 的 
筛选 。 

解 : 设 指数 分 布 的 分 布 函 数 为 : F(x) =1 -exp( -x/0)， 用 极 大 似 然 
估计 可 以 得 到 指数 分 布 的 参数 为 : 6=7.6, Agxz) =1 -exp( -x/7.6)。 将 


225 ， 


226 ， 


样本 经 验 分 布 函数 与 估计 函数 画 在 Fo 
同一 个 图 中 〈 见 图 10 -1)， 由 图 像 
可 以 看 出 ， 用 指数 分 布 来 拟 合 小 鼠 
生存 沙 数 并 不 合适 。 在 x 较 小 时 ， 
拟 合 值 大 于 样本 值 。 当 x 较 大 时 ， 
拟 合 值 小 于 样本 值 。 本 

【 例 10 -2】 考虑 如 下 的 20 个 
车 险 赔 付 数据 〈 见 表 10 -1)， 假设 
数据 在 50 处 被 截断 ， 用 做 图 法 检验 
可 否 用 指数 分 布 对 该 数据 样本 进行 
拟 合 ? 指数 分 布 的 参数 由 样本 数据 
估计 得 出 。 x 


图 10 -1 小 鼠 死亡 时 间 的 经 验 分 布 函数 图 像 








表 10 -1 车 险 赔付 数据 
27 82 | 11s 126 155 161 243 294 ” 340 384 
| 
457 680 855 | 877 974 1 193 1 340 1 884 2 558 3 476 


解 : 若 数据 在 50 处 截断 ， 截 断后 的 样本 数据 为 19 个 ， 若 使 用 指数 分 


布 对 该 数据 样本 进行 拟 合 ， 由 式 (9.2.6) 知 ， 似 然 函 数 为 ]] 1 | 


用 极 大 似 然 估计 可 以 得 出 该 指数 分 布 的 参数 为 : 8 = 802. 32, 则 分 布 函 
数 为 : 
F(%) =1 -exp(-0.001246x +0. 0623 ) 

将 样本 点 的 经 验 分 布 以 及 估计 的 
指数 分 布 图 像 编程 绘制 到 一 张 图 像 上 
( 见 图 10 -2)， 并 对 比 样 本 经 验 分 布 
与 指数 分 布 的 差异 大 小 。 

观察 图 10 -2 可知， 指数 分 布 的 
分 布 函 数 图 像 基 本 可 以 显示 数据 的 大 
小 与 变化 ， 但 是 在 x 较 小 时 拟 合 效果 
并 不 理想 ， 样 本 点 明显 高 于 分 布 函数 
图 像 ， 这 表明 在 x 取 较 小 值 时 模型 低 0 D0 O00 00 0 200 00 
佑 了 样本 。 加 

当 模 型 的 分 布 郑 数 和 经 验 分 布 函 
数 很 接近 时 ,很 难 从 图 像 上 分 辨 出 细 


F (x)=1-exp(-—0.001246x+0.0623) 





图 10 -2 样本 经 验 分 布 与 
指数 分 布 的 差异 


第 十 章 ”参数 模型 的 检验 和 选择 


微 的 差别 。 可 以 直接 画 出 两 个 
函数 差 值 的 图 像 。 也 就 是 说 ， 
如 果 F,(x) 和 Ff" (x) 分 别 表示 
经 验 分 布 酒 数 和 由 模型 得 到 的 
分 布 喇 数 ， 画 出 D(x) = F(x) 
一 FR" (x) 的 图 像 即 可 。 

图 10 -3 为 例 10-1 中 的 
D(x) 图 像 。 

由 图 10 -3 可见 F(x) 和 
F(x) 的 差距 在 +0.25 之 间 ， 
差距 较 大 ， 因 此 并 不 适合 用 指数 分 布 来 拟 合 样本 数据 ， 与 例子 结论 一 致 。 





10 -3 例 10 -1 中 数据 的 D(x) 图 像 


10.2.3 pp 图 和 QQ 图 比较 

p -p 图 ， 也 称 “ 概 率 图 ”(probability plot) ， 根 据 变量 的 经 验 分 布 与 指 
定 分 布 的 累积 分 布 函数 之 间 的 关系 所 绘制 的 图 形 。 通 过 p -p 图 可 以 检验 数 
据 是 否 符合 指定 的 分 布 。 其 步骤 如 下 : 首先 将 观测 值 排序 x, <… <x,， 再 
对 每 个 值 构造 坐 标 (F,(%)，F* (x,))， 最 后 将 每 个 坐标 对 应 的 点 画 在 
(F(x) ,Fi (x) ) 的 平面 上 。 当 数据 符合 指定 分 布 时 ，p -p 图 中 各 点 近似 呈 
一 条 45。 直 线 。 但 是 ， 在 这 种 情况 下 ， 必 须 对 经 验 分 布 函数 的 定义 有 所 修 
改 。 因 为 可 以 证 明 ，F,(x,) 的 期 望 值 为 j/(n 1)， 进 而 经 验 分 布 函数 在 该 
点 的 值 也 应 当 是 这 个 值 而 非 通常 的 取 值 j/n。 对 两 个 相同 的 观测 值 可 以 直接 
标 为 两 个 点 (它们 有 相同 的 “y” 坐 标 但 “x” 人 坐标 不 同 ) ， 也 可 以 取 “x%” 
坐标 的 平均 值 只 画 一 个 点 。 

如 果 p -p 图 中 各 点 不 旦 直线 ， 但 有 一 定 规律 ， 则 可 以 对 变量 数据 进行 
转换 ， 使 转换 后 的 数据 更 接近 指定 分 布 。 

【 例 10 -3】 由 10 只 试验 老鼠 组 成 的 样本 ， 甚 死亡 时 间 (以 天 为 单 
立 ) 为 : 3、4、5、7、7、8、10、10、10、12。 画 出 指数 分 布 的 p ~p 图。 

解 : 我 们 用 x,，…，xi。 来 表示 上 面 各 值 。 以 观测 值 x =4 为 例 ， 经 验 
分 布 值 汶 FF。(4) =2/11 =0. 1818 ， 另 一 个 坐标 的 值 是 : 

F*(4) =1 -exp( -4/7.6) =0.4092 

这 就 得 到 p 一 p 图 中 的 一 个 点 (0. 1818 ，0. 4092 ) 。 类 似 地 ， 可 以 得 到 所 有 
的 点 ， 其 图 形 见 图 10 -4。 

从 图 10 -5 可 以 看 出 ， 指 数 分 布 不 适合 描述 该 数据 的 分 布 。 m 

Q -Q 图 同样 可 以 用 于 检验 数据 的 分 布 。 所 不 同 的 是 ，Q -~ Q 图 是 用 样 
本 数据 的 经 验 分 位 数 与 所 指定 分 布 的 分 位 数 之 间 的 关系 曲线 来 进行 检验 的 。 
图 10 -5 是 例 10 -1 的 数据 的 Q - Q 图 。 
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F(x) 指数 分 布 P-P 图 


指数 分 布 Q-Q 终 
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图 10-4 例 10 -1 的 数据 pp 图 图 10-5 例 10 -1 数据 的 Q-Q 图 


当 分 析 p -Pp 图 和 Q-Q 图 时 ， 最 好 不 要 用 严格 的 标准 去 衡量 这 些 数据 
是 否 在 一 条 直线 上 ， 通 常 只 要 看 这 些 点 是 否 近 似 在 一 条 直线 上 即 可 。 另 外 ， 
当 判 断 概率 图 上 的 点 是 否 近 似 在 一 条 直线 上 时 ， 对 样本 点 中 两 端的 点 〈 即 
太 大 和 太 小 的 样本 点 ) 可 以 不 用 关注 ， 除 非 这 些 点 偏离 直线 特别 远 (因为 
两 端的 少数 样本 点 通常 会 和 直线 有 些 偏离 ) 。 但 是 ， 当 有 一 个 样本 点 偏离 直 
线 特别 远 ， 而 其 他 样本 点 又 基本 近似 在 直线 上 时 ， 偏 离 直 线 的 那个 样本 点 
则 视 为 离 群 点 ， 不 用 考虑 。 


10.2 4 平均 剩余 寿命 函数 图 
平均 剩余 寿命 函数 考虑 的 是 数据 在 尾部 的 情况 ， 其 定义 为 : 
e(d) =E[X-d|X>d] (10.2.1) 
如 果 平 均 剩 余 寿 命 泪 数 随 d 递增 ,那么 在 变量 取 值 较 大 处 的 期 望 结果 
会 很 大 ， 因 此 概率 向 碳 移 ， 说 明 其 尾部 相 比 那些 平均 剩余 寿命 郴 数 递减 或 
增 速 较 慢 的 模型 更 厚 。 反 之 ， 如 果 平 均匀 余 寿命 函数 随 d 递减 ,说 明了 对 的 
分 布 是 轻 尾 分 布 。 这 里 通过 样本 平均 剩余 寿命 函数 图 (d,e(d) ) 观 察 样 本 数 
据 的 尾部 特征 。 使 用 经 验 估 计 。 (ad) 来 代替 e(d)， 有 
> max(X,—-d,0) 
e(d) = 一 - (10. 2.2) 
2 Tx >a] 
如 果 平 均 剩 余 寿 命 函 数 图 呈现 上 升 的 趋势 ， 说 明 样 本 的 损失 分 布 是 一 
个 明显 的 厚 尾 分 布 ; 而 如 果 旺 现下 降 的 趋势 则 是 轻 尾 分 布 ; 指数 分 布 的 平 
均 超 额 函 数 图 近似 为 一 条 水 平 的 直线 。 
【 例 10-4】 表 10 -2 为 某 地 区 男性 经 验 生 命 表 (1990 一 1993 年 ) 的 
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部 分 数据 ， 请 用 平均 剩余 寿命 函数 说 明 指数 分 布 是 否 合适 描述 该 数据 。 































































































表 10-2 某 地 区 男性 经 验 生命 表 及 平均 期 望 寿命 表 

年 龄 ,AM, 9 L ds i 1, 全 
六 上 0. 03451 0. 03347 100 000 3 347 96 988 7 075 361 70.8 
1~4 0. 00185 0.00736 96 653 711 384 904 6 978 374 2 2 
5~9 0. 00058 0. 0029 95 941 279 479 011 6 593 470 68.7 
10~14 0. 00045 0. 00227 95 663 217 477 772 6 114 459 63. 9 
15 ~ 19 0. 00083 0.00415 95 446 396 -476 239 5 636 687 59.1 
20 ~24 0. 00105 0. 00525 95 050 499 474 001 5 160 448 54.3 

RE 

25 ~ 29 0. 00109 0. 00546 94 550 516 471 463 4 686 447 49. 6 
30 ~34 0. 00127 0. 00633 94 035 595 468 686 4 214 984 44.8 
35 ~39 0.0017 0.00847 93 440 792 465 220 3 746 297 40. 1 
40 ~44 0. 00249 0. 01235 92 648 1 144 460 380 3 281 077 35. 4 
45 ~ 49 0. 00392 0. 01939 91 504 1 774 453 084 2 820 697 30.8 
50~54 0. 00629 0.03098 89 730 2 780 441 698 2 367 613 26.4 
55~59 0.01007 0.04911 86 950 4 270 424 074 1 925 914 22.1 
60~64 0.01635 0.07856 82 680 6 495 397 161 1 501 840 18.2 
65~69 0. 02669 0 125122 76 184 9 532 357 092 1 104 679 14.5 
70 ~74 0.04475 0.20125 66 652 13 414 299 726 747 587 11.2 
75 ~79 0.07518 0.31641 53 238 16 845 224 078 447 861 8.4 
80~84 0. 12427 0.47406 36 393 17 252 138 833 223 784 6.1 
85 ~89 0. 19587 0. 65743 19 140 12 583 64 243 84 951 4.4 
90 ~94 0. 29391 0. 78096 6 557 2 17 423 20 708 ky 
95~99 0. 42003 0. 85022 1 | 1 221 2 907 3 285 2 
100 + 0. 56948 1 215 215 378 378 1.8 























如 果 可 以 假设 生存 函数 就 是 这 样 的 一 条 连接 各 个 点 的 直线 ， 则 可 以 计 
算 平 均 莘 余 寿命 函数 ， 可 以 用 给 定年 龄 的 曲线 下 方 的 面积 除 以 该 年 龄 的 生 
存 函数 计算 。 图 10 -6 为 平均 剩余 寿命 函数 的 图 形 。 出 生 后 不 久 的 微量 上 
升 说 明 1990 年 婴儿 的 死亡 率 较 高 ， 出 生 一 年 后 的 生存 个 体 的 期 望 剩余 寿命 
会 多 5 年 。 随 后 的 平均 剩余 寿命 平稳 递减 ， 这 符合 我 们 预期 的 衰老 模式 。 

比较 平均 剩余 寿命 图 可 以 发 现 ， 指 数 分 布 并 不 适合 描述 该 模型 。 指 数 
分 布 图 像 是 水 平 线 的 ， 而 由 观察 可 知 ， 剩 余 寿命 图 像 刚 开始 是 上 凸 ， 然 后 
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图 10 -6 平均 剩余 寿命 图 像 


下 凸 ， 与 指数 分 布 图 像 不 符 。 


10.3 分 布 的 拟 合 优 度 检 验 





图 像 可 以 直观 地 显示 拟 合 程度 的 优 劣 ， 但 是 有 时 候 “ 了 眼见” 未必“ 为 
实 ”， 通 过 严密 的 数学 论证 所 得 到 的 结论 才 更 具有 说 服 力 ， 统 计 假 设 检验 便 
是 长 期 以 来 为 人 们 所 信赖 的 一 种 “论证 ”。 

在 假设 检验 中 ， 我 们 先 要 设 定 原 假 设 和 备 选 假设 : 

HH,: 数据 来 源 于 某 个 给 定 的 总 体 ; 
互 ,: 数据 并 非 来 源 于 给 定 的 总 体 。 

针对 原 假设 的 不 同 ， 将 有 两 种 处 理 的 方式 。 如 果 原 假设 中 给 出 了 完整 
的 模型 (如 : 均值 为 0， 方差 为 1 的 标准 正 态 分 布 )， 检验 临 界 值 可 以 较为 
容易 地 得 出 ; 另 一 种 情况 是 原 假 设 仅仅 指明 了 模型 的 类 型 ， 而 模型 中 仍 含 
有 待定 的 参数 。 如 果 模 型 的 参数 是 通过 样本 数据 估计 得 出 〈 如 用 第 九 章 的 
参数 估计 方法 ) ， 这 时 的 检验 统计 量 要 比 事先 给 定 模 型 时 的 统计 量 要 小 。 这 
是 因为 参数 估计 时 ， 我们 会 尽量 使 得 分 布 函数 与 实际 数据 更 接近 ， 这 会 导 
致 假设 检验 变 成 了 近似 。 通 常 统计 量 较 大 时 容易 拒绝 原 假设 ,因此 这 种 近 
似 增加 了 犯 第 二 类 错误 的 概率 ， 同 时 减 小 了 犯 第 一 类 错误 的 概率 。 

针对 第 二 种 情况 ， 我 们 可 以 通过 将 样本 随机 分 组 的 方式 避免 近似 。 将 
样本 随机 分 为 两 部 分 ， 一 部 分 进行 参数 估计 ， 另 一 部 分 进行 假设 检验 。 当 
模型 选 定 之 后 ， 又 重新 将 所 有 数据 用 于 参数 估计 。 

在 本 节 接 下 来 的 内 容 中 ， 我 们 以 构造 不 同 的 检验 统计 量 为 主线 介绍 四 
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种 假设 检验 的 方法 : 拟 合 优 度 检验 、K -S 检验 、Anderson - Darling 检验 以 
及 似 然 比 检验 。 


10.3.1 X 拟 合 优 度 检验 


和 拟 合 优 度 检 验 常用 于 离散 分 布 的 情况 ， 如 果 是 连续 分 布 则 需要 把 镶 
据 分 成 多 个 区 间 来 考虑 。xX 拟 合 优 度 检验 实施 的 步骤 如 下 : 首先 ， 选 定 任 
意 丰 -工人 个 值 使 得 :=cy<cl <c<cl<c <c=o， 其 中 上 为 左 截断 点 〈 如 
果 没 有 截断 则 :=0)。 记 Pp)=F' (ec) -ER (co ) 为 观测 值 落 在 (c.,, c] 区 
间 中 的 概率 ， 要 注意 每 组 包括 组 上 上 限 ， 即 左 端 是 开 区 间 、 右 端 是 闭 区 间 。 
类 似 地 ， 记 p, = 了,(c) -ECc) 为 由 经 验 分 布 得 到 的 〈(c，c] 区 间 中 的 
概率 。 然 后 构造 x 检验 统计 量 为 : 


大 


O = Se < (10.3.1) 


入 


1 Pp; 
其 中 为 样本 量 。 车 令 E,= np 为 区 间 中 观测 值 个 数 的 期 望 值 ， 并 令 0, = mp。 
为 区 间 中 的 实际 观测 个 数 。 此 时 有 
(E, O) 
Q = > > (10.3.2) 


d= ji 


当 观 测 值 ”的 值 充分 大 时 ， 统 计量 8 的 分 布 会 收 合 于 自由 度 为 k 一 1 - 
m 的 x 分 布 ，m 为 模型 中 待 估 参 数 的 个 数 。 如 果 计 算得 到 的 0 大 于 临界 值 
Xe (FE-1-m)， 则 拒绝 原 假 设 ， 表 明 原 假设 中 的 分 布 不 能 拟 合 样本 数据 。 
否则， 无 法 拒绝 原 假 设 。 这 里 a 通常 取 0.05。 

在 * 拟 合 优 度 检验 中 ， 一定 要 注意 满足 : 样本 容量 n 要 足够 大 、E, 不 
太 小 这 两 个 条 件 。 为 提高 模型 估计 的 精度 ， 通 常 认为 5, 的 值 不 小 于 5， 总 
体 的 样本 数据 不 小 于 50 ， 否 则 需要 将 个 数 较 少 的 组 合并 ， 以 满足 这 个 要 求 。 
经 验 表明 ， 当 5 的 值 大 致 相等 时 ,检验 的 效果 是 最 优 的 。 所 以 当 对 个 体 数 
据 进 行 检验 时 ， 应 该 适当 地 分 组 ,使 检验 的 效果 尽 可 能 好 。 

【 例 10 -5】 设 某 保险 人 经 营 茶 车 辆 险 ， 对 过 去 所 发 生 的 1 000 次 理赔 
情况 做 了 记录 ,平均 理赔 额 是 2 200 元 ， 又 按 赔付 金额 分 作 5 档 ， 各 档 中 的 
记录 次 数 如 表 10 -3 所 示 。 试 用 xX 拟 合 检验 判断 是 否 能 用 指数 分 布 来 拟 合 
个 体 理赔 额 的 分 布 。 








表 10 -3 车 险 赔 付 频 率 统计 
赔付 额 (元 ) 0~1 000 1 000 ~2 000 | 2 000 ~3 000 | 3 000 ~4 000 | 4 000 ~5 000 | 5 000 元 以 上 
次 数 | 200 | 30 | 250 | 150 | 10 | 5 








解 : 先 设 个 别 理 赔 额 不 服从 指数 分 布 ， 使 用 掏 估 计 或 极 大 似 然 估计 可 
以 估计 出 入 =2200。 


* 231 - 


精算 模型 


， 232 。 


由 一 一 一 一 一 > 
下 面 计 算 E,: 
五 =nP (Xe(l(C..,C.]) =n (F (C; A)-F (Ci; A)) (10.3.3) 
例如 ， 在 2 000 ~3 000 组 内 的 E, 为: 
3 000 
1 000 x| ea = 1000 x (e™™* -ee”™) = 1 000 x0.1472 = 147.2 
2 000 


类 似 地 ， 可 以 计算 得 到 其 他 组 的 平均 次 数 : 
E, =365.3, E,=231.8, E,=93.4, E,=59.3, E,=103 
因此 , x 统计 量 的 值 为 : 


(200 -365.3)”， (300 -231.8)”，... , (5 ~-103) 
365.3 231.8 103 


XX 分 布 的 自由 度 为 上 -1 -mm=6-1-1=4， 查 表 得 ， X66os (4) =9.487， 
因此 ，Q@>xas (4) =9.487， 故 应 拒绝 原 假设 ， 即 选择 指数 分 布 不 恰当 。 里 

【 例 10 -6】 使 用 表 10 -1 的 数据 ,用 拟 合 优 度 检验 的 方法 验证 可 否 
使 用 指数 分 布 进行 拟 合 。 

解 : 在 10.2 节 中 ， 我 们 曾经 用 分 布 函数 与 经 验 分 布 函数 图 像 比较 的 方 
法 进行 了 初步 直观 的 判断 ， 认 为 可 以 用 指数 分 布 进行 拟 合 , 现在 用 拟 合 优 
度 检验 方法 进一步 判断 。 

首先 将 数据 分 为 6 档 ， 然后 计算 相应 的 x 值 ， 得 到 表 10 -4。 





Q= =322. 13 






































表 10 -4 二 拟 合 优 度 检验 x 值 
区 间 期 鹿 什 观察 值 个 数 x 
50~150 0. 1172 2. 227 3 0. 2687 
150 ~250 . 0. 1035 1.966 3 0. 5444 
EE 250 ~ 500 0.2087 i 3.964 4 0. 0003 
500~1 ooo | 0.2647 5. 029 4 0.2105 
1 000 ~2 000 0. 2180 4. 143 3 0. 3152 
2 000 ~ o 0. 0880 1. 672 这 0. 0644 
合 计 1 19 19 1. 4034 











自由 度 为 上 -1-mm=6-1-1=4，aw 水 平 为 5 多 时, x 临界 值 为 9.4877,，P 值 
为 0.8436。 因 此 可 以 得 到 结论 : 可 以 用 指数 分 布 来 拟 合 此 数据 。 面 


10.3.2 K-S 检 验 


TE- E OT ET DE 


kK ~S 检验 用 来 检验 单一 样本 是 否 来 自 某 一 特定 分 布 ， 比 如 检验 一 组 数据 
是 否 为 正 态 分 布 。 这 个 检验 的 思想 是 : 虽然 了 ，Y,,…,Y, 的 分 布 未 知 ， 但 根 
据 大 样本 理论 ， 了 ，Y,,… ,了 的 经 验 分 布 旺 数 F,(x) 在 某 种 意义 下 收敛 于 其 
真实 的 分 布 ， 所 以 可 以 把 (xz) 与 所 假设 的 分 布 函数 RF" (x) 作 比 较 ， 看 它们 
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是 否 易 合 。 如 果 它 们 不 能 很 好 地 吻合 ， 就 拒绝 H。,， 即 未 知 的 真实 分 布 函 数 不 
是 由 "(x) 给 定 的 。 由 于 经 验 分 布 已 (x) 和 分 布 "(x) 都 是 x 的 函数 ， 所 
以 要 比较 两 者 的 差异 需要 一 个 合适 的 度量 。Kolmogorov - Smirnov 检验 提出 
一 个 最 简单 的 度量 ， 就 是 用 F" (x) 和 F(x) 在 垂直 方向 上 的 最 大 距离 作为 
统计 量 。 令 + 为 左 截断 点 (如 果 没 有 截断 则 := 0) , u 为 右 删 失 点 (如 果 没 
有 删 失 则 w = m ) 。 这 时 检验 统计 量 为 : 
D,=max|F.(y) -RE (7) | (10. 3.4) 
需要 注意 的 是 ， 为 确保 F,(x) 有 定义 ,这 个 统计 量 只 适用 于 个 体 数 据 ， 
且 要 求 F" (x) 在 对 应 区 间 上 是 连续 的 。 由 于 经 验 分 布 函数 已 (*) 在 每 个 数 
据点 都 有 跳跃 ， 因 此 需要 将 分 布 函 数 与 跳跃 前 的 值 都 进行 比较 。 具 体 来 说 ， 
如 果 已 知 一 个 样本 观测 值 %,，…，x,， 则 D, 为 FR" (x) 与 F(x) 差距 的 最 大 
值 为 : 
D, = max { | Fm.1) —F" (x,0) | , | F(x) —F° (x.,0) | | (10. 3. 5) 


用 Y= YnD, 来 表示 被 检验 
的 实际 偏差 度量 ， 其 中 为 样本 
数 。 对 于 小 的 ” 值 ， 表 10 -5 给 
出 了 了 在 不 同 显著 性 水 平 下 的 临 
界 值 。 

如 果 w < o ， 临 界 值 还 应 当 
取得 更 小 。 

当 n 一 ww 时， 车 Ff' (x) 的 
函数 形式 完全 给 定 , 了 的 近似 分 图 10-7 -S 统计 量 意 义 的 图 像 展 示 
布 为 : 





Pp Y 2 es 1 jtl 27? 
0 表 10 -5 天-S 不 同 显著 性 

















(10.3.6) 水 平 下 的 YY 的 临界 值 
车 "(x) 的 形式 已 知 ， 参 数 由 数据 。” 吕 甘 性 水 (a) | 洲 界 信 
估计 ,偏差 度量 Y= VnD, 将 取得 与 0.2 1.07 
前 面 结果 不 同 的 概率 值 ， 在 这 种 情 。 0.1 1.22 
况 下 则 需要 对 Y 进行 修正 。 例 如 ， 0.05 1236 
假定 一 个 指数 模型 ，6 由 数据 估计 而 ol 1 
得 ， 则 
有 (2. (+026+ 二 (10.3.7) 


为 一 个 比 未 修正 了 = VnD, 更 好 的 估计 。 关 于 这 些 修正 的 具体 方法 和 临界 值 
表 ， 可 见 Stephens，M. (1986) 的 论文 。 
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【 例 10 -7】 我 们 仍然 以 例 10 -2 中 的 车 险 数据 (在 50 处 截断 ) 为 
例 ， 我 们 依然 用 指数 分 布 来 拟 合 数据 ， 并 用 数据 来 估计 分 布 参数 。 最 后 使 
用 K -Ss 检验 来 说 明 指 数 分 布 是 否 为 合适 的 拟 合 分 布 。 
解 : 对 于 此 数据 ， 截 断后 分 布 F(x,6) 为 : 
-e™”—- (ll-e™™”) 
1— (1-e ”?) 
将 经 验 分 布 函 数 和 估计 分 布 列表 ， 见 表 10 -6。 


(= —50)/802.32 
三 于 过 十 (=-50) 


F(x) = 


表 10 -6 K -S 检验 统计 量 计算 结果 




























































































经 过 对 最 大 值 的 简单 观察 便 可 得 出 : D 统计 量 为 0.134。Y =0.134 V19 = 
0. 5841 小 于 5% 水 平 的 临界 值 1. 36 说 明 指 数 分 布 是 合适 的 分 布 。 可 

【 例 10 -8】 给 出 索赔 额 样 本 数据 如 下 : 29，64，90，135，182。 原 
假设 是 样本 来 自 指数 分 布 。 指 数 分 布 参数 用 矩 估 计 的 方法 给 出 ， 计 算 K-S 
统计 量 的 值 。 


解 : 首先 均值 6 = 到 =100， 则 原 假设 的 分 布 函数 为 : F (zx) =1 -em。 
则 天 -S 统 计量 与 计算 结果 如 表 10 -7 所 示 。 
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表 10 -7 例 10-8 的-S 统计 量 计 算 结 果 












| F.Cx) -F* (x) | 


























29 0.2 0.252 0.052 0.252 

64 0.4 0.2 0. 473 0. 073 0.273 

90 0.6 0.4 0. 593 0. 007 0. 193 

135 0.8 0.6 0.741 0.059 0. 141 
0. 162 














对 表格 最 后 两 行 的 简单 观察 可 以 得 出 人 K-S 统 计量 的 值 为 0.273。 大 

拟 合 优 度 检 验 与 K -S 检验 都 是 采用 实际 频数 与 期 望 频数 之 差 进 行 检 
验 。 它 们 之 间 的 不 同 在 于 前 者 主要 用 于 分 组 数据 ,而 后 者 用 于 有 计量 单位 
的 连续 和 定量 数据 。 拟 合 优 度 检验 虽然 也 可 以 用 于 定量 数据 ,但 是 必须 先 
将 数据 分 组 才能 获得 实际 的 观测 频数 ; K -S 检验 可 以 直接 对 原始 数据 的 
个 观测 值 进 行 检 验 ， 所 以 它 对 数据 的 利用 较为 完整 。 


10. 3.3 Anderson - Darling 检验 

K - S 检验 只 是 简单 地 建立 在 经 验 分 布 F,(x) 和 模型 分 布 "(x) 之 间 
的 最 大 偏差 基础 之 上 ;TT. W. Anderson 和 D. A. Darling 提出 de Anderson-Dar- 
ling 检验 给 出 了 分 布 Ff,(x) 和 分 布 fF' (x) 之 间 偏 差 的 更 好 度量 。Anderson- 
Darling 统计 量 是 Ff,(x) 和 分 布 r(x) 之 间 偏 差 的 平方 的 加 权 期 望 值 ， 权 重 
是 F.(x) 方 差 的 倒数 ， 即 
» [F(x) -F(x)] 
:F(x)[1—- F(x)] 
其 中 上 和 zx 的 定义 与 K - S 检验 相同 。 注 意 当 x 接近 于 :或 w 时， 分母 很 小 ， 
从 而 权重 较 大 ， 因 此 这 个 统计 量 更 加 看 重 尾部 的 估计 。 这 个 积分 很 难 计 算 ， 
但 是 对 于 个 体 数据 来 说 ， 记 无 重复 的 未 被 删 失 的 数据 点 为 i=y。<y,<… < 
Yim =z， 则 积分 变 为 如 下 的 求 和 形式 : 


4” =n f° (x)dx (10. 3.8) 


A = nF Cu) ta [1 FT (Fy)) -In (1 F* (ya))) 


+n), F,(y) [lnR (yy) -ln F*(y,)] (10. 3.9) 


车 w= % ， 则 第 一 个 求 和 项 的 最 后 一 项 等 于 0。 
t=0, w=% 时， 可 以 证 明 式 〈(10.3.8) 与 下 面 公式 等 价 9 


眶 





@ 证 明 参 见 李 晓 林 、 孙 佳美 编著 :《 生 命 表 基础 》 附录 A， 中 国 财政 经 济 出 版 社 2006 年 版 。 
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A = -nly OUDbDnIP Ca) .SCx.)]) (10.3.10) 


与 式 (10.3.8) 相 比 ,， 式 (10. 3.10) 在 计算 4 时 更 方便 一 些 。 显 著 
性 水 平 为 10%、5% 和 1% 的 临界 值 分 别 是 1.933、2. 492 和 3. 875。 如 果 
uw < % ， 这 些 临界 值 还 应 当 更 小 一 些 。 

【 例 10 -9】 为 便于 方法 间 的 比较 ， 我 们 仍 使 用 例 10 -2 中 的 车 险 数 
据 作 为 拟 合 的 样本 数据 。 

解 : 根据 式 (10. 3.9) 对 以 上 样本 数据 做 列表 运算 ， 见 表 10 -8。 































































































表 10 -8 Anderson - Darling 检验 统计 量 计算 结果 
0. 
0. 0 
7 294 0.2622 0.3684 0. 0426 
8 340 0. 3033 0.4211 0.0389 
9 384 0. 3405 0. 4737 0. 0601 
10 457 0. 3979 0. 5263 0. 1490 
11 680 0. 5440 0. 5789 0. 0897 
12 855 0. 6433 0.6316 0. 0099 
13 877 0. 6433 0. 6842 0. 0407 
14 974 0. 6839 0. 7368 0. 0758 
15 1 193 0. 7594 0. 7895 0. 0403 
16 1 340 0. 7997 0. 8421 0. 0994 
17 1 884 0. 8983 0. 8947 0. 0592. 
18 2 558 0. 9561 0.9474 0. 0308 
19 3 476 0.9860 1.0 0.0141 
20 ow 1.0 1.0 0 
二 
合计 1. 0226 





例如 ， 表 中 求 和 项 的 第 三 个 数据 的 计算 公式 是 : 
0. 0126 = (1 -0.10532)’[ ln (1 -0.0778) -ln (1 -0.0904) 
+0.10532’[ In (0. 0904) -ln (0.0778)] 
42 统 计量 等 于 -19 (1) +19 (1.0226) =0.4292, 小 于 5% 的 临界 值 
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2.492， 因 此 指数 分 布 可 以 作为 该 车 险 数据 的 拟 合 分 布 。 
【 例 10 -10】 对 于 例 10 -1 中 的 样本 数据 ， 假 设 3S (ti) =exp( ~0.052)， 
利用 式 (10. 3. 10) 计算 4 统计 量 的 值 并 给 出 检验 的 结果 。 
解 : 表 10 -9 给 出 了 统计 量 4 的 计算 过 程 。 



































表 10 -9 Anderson - Darling 检验 统计 量 
bE s F* (4) S* (tj) (2i-1) ln [F* (6) S(t.))] 
1 3 0. 13929 0.54881 -2.57120 
2 4 0.18126 0. 60653 一 6. 62347 
3 | 5 0. 22120 0. 60653 一 10. 04345 
4 6 0. 29531 0. 60653 一 12. 03812 
5 7 0. 29531 0. 67032 -14.57757 
6 8 0. 32967 0. 70469 一 16. 05626 
7 9 0. 39346 0. 70469 一 16. 67605 
8 10 0. 39346 0. 77880 —17.74165 
9 11 0.39346 0. 81873 一 19. 25721 
10 12 0. 45118 0. 86070 一 17. 97207 
| 
合计 -133.55705 














to 


由 式 〈10.3.10), =-10- 上 上 


10 oi (25 J 1)1n [F* (z) S(t)] > 则 检验 统计 


量 的 值 可 以 由 以 上 表格 的 求 和 式 得 出 ， 为 : 4” = -10 -证 ( — 133. 55705 ) 


=3.35571。 
A 统计 量 0.01 的 显著 性 水 平 下 对 应 的 值 为 3.857， 则 3.35571 < 
3. 857， 因 此 可 以 判断 可 以 用 该 指数 分 布 进行 拟 合 。 于 


在 使 用 这 些 拟 合 优 度 检验 法 时 ， 需 要 注意 样本 容量 对 检验 结果 的 影响 。 
假设 样本 容量 加 倍 但 样本 点 的 取 值 并 没有 太 大 变化 (想象 每 个 数据 点 都 重 
复出 现 两 次 ) ， 在 Kolmogorov-Smirnov 检验 中 检验 统计 量 不 变 ， 但 临界 值 会 
变 小 ; 在 Anderson-Darling 和 x 拟 合 优 度 检 验 中 ， 检 验 统计 量 会 加 售 但 临界 
值 不 会 改变 。 这 使 得 对 于 较 大 容量 的 样本 ， 原 假设 更 容易 被 拒绝 。 这 也 很 
容易 理解 ， 因 为 原 假设 本 身 就 是 错误 的 〈 由 几 个 参数 决定 的 某 个 分 布 函数 
就 能 够 合理 解释 观测 值 表现 的 各 种 复杂 现象 ， 完 全 解释 的 可 能 性 极 小 ) ， 但 
只 有 在 样本 容量 足够 大 的 时 候 ， 才 会 有 可 以 令 人 信服 的 证 据 来 说 明 这 一 点 。 


10.3.4 似 然 比 检验 


与 前 面 三 种 检验 不 同 的 是 ， 似 然 比 检验 考虑 的 是 两 个 分 布 的 比较 。 该 
检验 的 原 假 设 和 备 选 假设 分 别 为 : 
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如 ,: 数据 来 自 服从 A 分 布 的 总 体 ; 
H,: 数据 来 自 服从 B 分 布 的 总 体 。 
为 了 能 够 进行 正规 的 假设 检验 ，A 分 布 必 须 是 B 分 布 的 一 种 特殊 情形 ， 
如 措 数 分 布 相 对 于 件 玛 分 布 。 具 体 来 说 ,假定 总 体 分 布 的 密度 孙 数 (连续 
型 ) 或 概率 分 布 函数 (离散 型 ) 为 f(x;09)， 其 中 0 为 参数 ， 且 06e@。 似 
然 比 检验 考虑 如 下 假设 检验 问题 : 
H,: 0 ee OQ,, 
H: GeQ,=O-O, 
其 中 98, 为 8 的 一 个 子 集 。 
对 于 给 定 的 样本 太 ，%%，…,%， 似 然 函 数 为 (0) = T[ zs9) 。 定 义 
统计 量 
要 sup{L(09):06e OO} 
sup{L(0):0¢€ ©,| 
称 LR 为 似 然 比 (Likelihood Ratio)。LR 的 分 子 是 参数 没有 被 约束 的 似 然 函 
数 最 大 信 ， 分 母 是 参数 被 约束 时 的 最 大 值 。 显 然 有 : LR 宇 1。 


根据 极 大 似 然 估 计 的 性 质 ，9 的 极 大 似 然 估计 9 是 9 的 相合 估计 ， 即 : 6 


6 (nw )。 所 以 当 假设 所 为 真 时 ,6 应 以 大 的 概率 属于 B@。。 这 时 ， 如 果 
似 然 晴 数 L(98) 具 有 连续 性 (大 多 数 场 合 都 是 这 样 的 )， 似 然 比 LR 应 接近 于 
1。 反 之 ，LR 应 该 远大 于 1。Wilks 在 1938 年 证 明了 : 在 一 定 正则 的 条 件 下 ， 
Y, =2InLR 在 原 假设 下 以 x 分 布 为 极限 分 布 ， 参 数 为 大- r, 为 没有 被 约束 的 
参数 个 数 ，r 为 被 约束 的 参数 个 数 。 若 8@, = 06,，0。 为 已 知 参数 ， 则 r=0。 
若 已 大 于 置信 水 平 为 a 临界 值 c， 则 拒绝 原 假设 ， 即 认为 6s@,。 

【 例 10 -11】 一 个 来 自 指数 分 布 总 体 X 的 样本 包含 8 个 数据 : 1.0， 
1.2, 1.3, 1.7,1.9, 2.0, 2.4, 2.5。 在 5% 显著 性 水 平 下 进行 如 下 似 然 
比 检 验 : 

H,: 06=2, H,: 92 


(10. 3.11) 


解 : 似 然 函数 是 L(0) 一 I /x.) 二 Lee 到 Le 
在 原 假 设 下 ，69, =2， 则 


L, = L(0,) = L(2) = 2 2 = 0. 000003562 
根据 样本 数据 ， 对 9 的 极 大 似 然 估计 是 69, = x =1.75， 此 时 有 : 
1 
1.75° 





L, = L(0,) = L(1.75) = e- 之 xz.75 -= 0. 000003814 
L 
似 然 比 统计 量 是 了 =2ln 于 =0.14， 且 自由 度 是 1， 此 时 对 应 5% 显著 性 
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水 平 下 的 临界 值 是 Xoo (1) =3. 84 > T， 因 而 此 时 无 法 拒绝 原 假设 。 时 

【 例 10 -12] 假设 机 动车 辆 险 中 私人 小 汽车 的 赔付 额 服 从 指数 分 布 。 
表 10 -10 的 数据 是 两 个 不 同 品牌 的 汽车 发 生 的 赔付 额 。 根 据 这 批 数 据 能 否 
断定 这 两 个 品牌 的 汽车 的 赔付 额 服从 同一 指数 分 布 ?〈( 取 a =0.05)? 








表 10-10 汽车 品牌 与 赔付 额 
品牌 赔付 额 ( 百 元 ) 
| 
A | 74 57 48 29 502 i 70 2 486 S9 PA 
B | 55 320 56 104 220 239 47 246 176 182 33 


解 假定 这 两 个 品牌 的 汽车 的 赔付 额 分 别 服从 参数 为 9 和 9, 的 指数 分 
布 。 根 据 题 意 ， 原 假设 为 : H,: 6, = 0,。 对 参数 作 一 变换 ， 记 : 6, =6，6, = 
9+d， 则 上 上述 假设 就 转换 为 : 
H: d=0 。 
用 xj 和， xu 和 7，7，7 ,yo 分别 记 两 组 数据 ， 其 中 m =11， 
ma; 三 11。 样 本 均值 分 别 记 为 : Xx*，Y， 记 样本 总 均值 为 z， 则 x=109.5, y= 


152.5, z= 130.1， 无 约束 参数 的 极 大 似 然 估计 值 为 : 6 = 109.5，9， 


当 假 设 本 成 立时 ， 参 数 的 极 大 似 然 估计 值 为 : 


0,= 0,= z=130.1 
对 数 似 然 函 数 为 : 
1(0 9) =-(》x《6+ ,7/0,) -mln6 -mln6 (10.3.14) 


似 然 比 统计 量 为 : 2InLR =2[! (0,, 0,) -1 (6,，6,)] =0.6316。 

由 于 2lnLR 渐进 分 布 为 x;,，(1)， 在 显著 性 水 平 w =0.05 下 , x (1) 
=3.841， 因 此 2lnLR <xss。 (1)， 故 接受 原 假设 ， 即 认为 两 个 品牌 的 汽车 
的 赔付 额 服 从 同一 指数 分 布 。 本 

在 使 用 似 然 比 检 验 时 ， 原 假设 的 分 布 应 是 备 选 假设 分 布 的 特殊 情形 。 
当 原 假设 为 备 选 假 设 的 极限 情形 时 (不 是 一 种 特殊 情形 ) ， 似 然 比 检验 仍 
然 适 用 ， 此 时 检验 统计 量 服 从 混合 x 分 布 。 但 是 当 备 选 假设 分 布 仅 比 原 假 
设 分 布 具 有 更 多 的 参数 时 ， 似 然 比 检验 是 不 合适 的 。 人 例如， 两 参数 的 对 数 
正 态 模 型 完全 有 可 能 比 三 参数 的 Burr 模型 的 对 数 似 然 函 数值 大 ， 这 样 就 会 
产生 负 的 检验 统计 量 ， 进 而 无 法 使 用 * 分 布 。 


10.4 最 优 模型 后 选 笃 
在 对 众多 备 选 模型 进行 了 分 布 图 像 的 比较 和 相关 的 拟 合 检验 之 后 ， 铜 
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下 的 任务 是 作出 最 终 的 选择 。 在 筛选 时 ， 需 要 注意 节俭 原则 和 相对 最 优 
原则 。 

1. 节俭 原则 : 对 于 具备 同样 条 件 的 模型 ， 在 没有 充分 的 理由 支持 复杂 
模型 时 ， 简 单 模型 是 更 好 的 选择 。 这 是 因为 虽然 复杂 模型 对 已 知 数据 拟 合 
得 很 好 ， 但 是 并 不 能 保证 对 观测 总 体 的 拟 合同 样 好 。 这 与 大 多 数 假设 检验 
的 方法 是 一 致 的 : 如 果 没 有 十 分 有 力 的 证 据 ， 就 不 要 拒绝 原 假 设 。 

2. 相对 最 优 原则 : 无 论 选 择 哪个 模型 ， 它 都 是 对 实际 情况 的 一 种 近 
似 。 模 型 选择 目标 是 找到 一 个 能 够 解决 问题 的 足够 好 的 模型 ， 而 足够 好 的 
定义 将 取决 于 具体 的 应 用 。 如 果 尝 试 了 足够 多 的 模型 ， 即 使 所 有 的 尝试 过 
的 模型 拟 合 效果 都 不 足够 理想 ,但 总 会 有 一 个 模型 是 相对 不 错 的 ， 虽 然 这 
并 不 能 提高 我 们 对 总 体 性 质 的 认识 。 

因此 ， 我 们 在 选择 模型 时 要 注意 在 简洁 性 与 精确 性 之 间 权 衡 。 只 要 可 
能 ， 应 尽量 选择 简单 的 模型 ， 且 还 页 根据 实际 情况 来 限制 备 选 模型 的 范围 。 
例如 ， 选 择 便于 计算 的 模型 来 厘定 费 率 ， 或 者 选择 厚 尾 分 布 来 估计 再 保险 
损失 等 。 这 需要 建 模 者 有 丰富 的 经 验 才能 缩减 备 选 模型 的 范围 。 

本 节 内 容 将 分 别 介绍 两 类 模型 选择 标准 ， 第 一 类 标准 是 基于 建 模 者 的 
主观 判断 ， 而 第 二 类 标准 更 为 规范 ， 使 得 大 多 数 人 情况 下 所 有 人 都 会 通过 分 
析 得 出 相同 的 结论 ， 因 为 后 者 的 结论 不 是 由 图 形 和 表格 的 直观 印象 得 来 ， 


- 面 是 通过 对 数据 的 定量 分 析 得 到 的 。 


10.4.1 主观 判断 法 

主观 判断 法 是 指 根据 精算 师 的 经 验 和 实际 背景 来 确定 备 选 模型 ， 筛 选 
模型 。 主 要 从 以 下 三 个 方面 来 考虑 : 

第 一 ， 可 以 根据 本 章 介 绍 的 各 种 图 表 工 具 (或 者 基于 图 形 的 表格 ) 进 
行 基本 的 判定 。 例 如 利用 经 验 分 布 图 ( 卵 形 图 )、 直 方 图 、 核 密度 图 等 ， 
比较 经 验 分 布 的 对 称 性 、 偏 斜 程度 以 及 分 布 的 扁平 程度 是 否 与 备 选 的 分 布 
消 数 一 致 。 有 了 时 还 要 比较 经 验 分布 的 尾部 特征 ， 是 否 有 很 长 的 尾部 ， 是 否 
存在 厚 尾 。 在 进行 真正 的 分 析 时 可 以 集中 在 关系 重要 的 方面 ， 例 如 ， 有 时 
候 对 尾部 概率 的 拟 合 非常 重要 ， 而 有 时 候 众 数 的 匹配 更 重要 。 即 便 是 评分 
法 ， 也 可 以 运用 一 幅 具 有 说 服 力 的 图 形 来 支持 选 定 的 模型 。 

第 二 ， 根 据 行业 缘 景 和 使 用 目的 来 选择 模型 。 有 了 时候 评 分 法 认为 某 个 
模型 的 拟 合 效 果 可 能 比 其 他 模型 要 好 很 多 , 但 是 从 计算 方便 的 角度 来 说 ， 
可 能 另 一 个 模型 虽然 拟 合 效果 稍微 差 些 ,但 能 使 某 些 计 算 大 为 简化 。 比如 ， 
1941 年 的 美国 保险 委员 会 标准 寿命 表 (Commissioners’ Standard Ordinary 
Mortality Table ，CSO) 在 许多 年 龄 段 都 采用 了 Makeham 分 布 。 在 计算 能 
有 限 的 年 代 ， 这 种 分 布 使 得 对 联合 生存 相关 和 值 的 计算 大 大 简化 。 类 似 地 ， 
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在 一 般 责 任 保险 和 机 动车 第 三 责任 险 中 ,精算 师 普遍 使 用 截断 帕 累 托 作 为 
损失 的 分 布 ， 因 为 该 分 布 具 有 某 些 良好 的 性 质 。 那 么 当 采 用 其 他 分 布 时 ， 
可 能 就 需要 提出 比 通常 情况 更 充足 的 证 据 才 行 。 

第 三 ， 分 布 可 能 完全 由 具体 情形 决定 。 例 如 ， 某 健康 险 合 约 为 女性 投 
保 人 提供 每 年 至 多 两 次 乳腺 瘤 和 宫颈 瘤 的 两 瘤 利 查 体 检 ， 而 投保 个 体 每 年 
会 有 两 次 独立 的 选择 ， 决 定 是 否 进 行 体 检 ， 如 果 每 次 决定 体检 的 概率 是 9， 
则 体检 次 数 必然 服从 m =2 的 二 项 分 布 。 


10. 4.2 评分 法 


当 存 在 多 种 分 布 可 以 用 来 拟 合 样本 数据 的 分 布 时 ， 我们 应 该 选择 一 个 
“最 优 ” 的 分 布 作为 样本 数据 的 分 布 。 一 种 简单 的 方法 是 为 每 个 模型 打分 ， 
得 到 最 优 分 数 的 模型 将 被 选择 。 常 用 的 打分 方法 及 判断 标准 如 表 10 - 11 
所 示 。 

















表 10 -11 评分 方法 及 判断 标准 
方 ” 法 分 数 依 据 判断 标准 
似 然 函 数 法 极 大 似 然 函 数值 越 大 越 好 
xX? 拟 合 优 度 检 验 法 这 统计 量 的 值 越 小 越 好 
xX? 拟 合 优 度 p 值 法 p 值 : p =P (x? >Q) 越 大 越 好 
K - S 检验 法 K - S 检验 统计 量 越 小 越 好 
Anderson - Darling 检验 法 Anderson -~ Darling 统计 量 越 小 越 好 





在 使 用 这 几 种 判断 标准 时 ， 需 要 考虑 参数 的 个 数 对 分 值 的 影响 。 拟 合 
程度 也 可 能 随 着 模型 复杂 度 的 增加 而 增加 。 以 似 然 函 数 法 为 例 ， 当 比较 指 
数 模 型 和 伽 玛 模型 对 某 样 本 的 拟 合 程度 时 ， 因 为 指数 分 布 是 伽 玛 分 布 的 特 
殊 情 形 ， 因 此 佑 玛 模 型 的 似 然 函 数值 不 小 于 指数 模型 的 似 然 明 数 值 ， 得 到 
伽 玛 分 布 总 会 胜 过 指数 分 布 的 结论 。 这 违背 了 节俭 原则 。 对 于 表 10 -11 中 
的 五 种 方法 ， 除 Xx? 拟 合 优 度 p 值 法 不 受 模 型 复杂 度 的 影响 ， 其 他 方法 都 存 
在 节俭 原则 上 的 不 足 。 其 原因 是 ， 随 着 模型 复杂 程度 的 增加 ， 检 验 的 自由 
度 减 小 ， 所 以 复杂 的 模型 也 可 能 有 和 较 小 的 p 值 。 因 此 从 节俭 原则 的 角度 出 
发 , x 拟 合 优 度 p 值 是 最 优 的 评分 方法 。 

如 果 用 似 然 函 数 作为 评分 的 标准 ， 为 了 不 违背 节俭 原则 ， 有 两 种 解决 
的 方法 。 一 种 是 进行 似 然 比 检验 ， 它 适合 于 一 个 模型 是 另 一 个 模型 的 特例 
时 〈 例 如 伽 玛 模型 和 变换 何 玛 模型 ) ， 或 者 一 个 模型 是 另 一 个 模型 的 极限 
情形 时 例如 Bul 分布 和 韦伯 分 布 )。 可 以 首先 从 单 参数 的 模型 (有 极 大 
似 然 函 数值 的 模型 ) 开始 ， 然 后 和 两 参数 模型 比较 ， 如 果 两 参数 模型 的 极 
大 似 然 函数 值 增加 了 至 少 1.92 〈 将 这 个 增 量 加 倍 就 得 到 临界 值 的 增 量 


. 241 . 


精算 模型 


. 242 ， 


3. 84) ， 则 采用 两 参数 模型 。 再 考虑 三 参数 模型 ， 如 果 和 两 参数 模型 比较 ， 
仍然 需要 1. 92 的 增 量 ， 而 如 果 第 一 步 保 留 了 单 参数 模型 ， 则 三 参数 模型 必 
须 有 3. 00 的 增 量 才 能 被 采用 (因为 该 检验 的 自由 度 是 2)。 若 要 增加 三 个 
参数 ， 则 需要 3. 91 的 增 量 ， 四 个 参数 需要 4.74 的 增 量 ， 等 等 。 似 然 比 检 
验 也 可 以 在 模型 之 间 没 有 包含 关系 的 情形 中 使 用 ,但 是 可 能 无 法 认为 这 种 
情形 下 仍然 在 进行 似 然 比 检验 。 除 特殊 情形 外 ， 似 然 比 检验 也 面临 着 其 他 
假设 和 检验 相同 的 问题 。 当 样本 容量 加 们 时， 对 数 似 然 函数 值 也 会 加 信 ， 使 
得 参数 个 数 更 多 的 模型 更 容易 被 选择 ， 这 将 使 得 违背 节俭 原则 的 结果 出 现 。 

另 一 种 是 在 引入 新 的 参数 时 有 一 定 的 惩罚 ， 可 考虑 Schwarz Bayesian 准 
则 (SBC) 或 AIC 信息 准则 之 类 的 判定 准则 。SBC 准则 衡量 模型 时 将 对 数 
位 然 函 数值 减 (r/2)lIn n， 即 SBC =lIn 工 -(r/2)lIn n， 其 中 7 是 待 估 参 数 的 个 
数 ，n 是 样本 容量 。 这 样 一 来 ， 只 有 对 数 似 然 函 数 增加 0. SIn n 才能 增加 一 
个 参数 ， 样 本 容量 越 大 ， 要 求 的 似 然 函 数 增 量 就 越 大 ， 但 这 个 要 求 的 增 量 
并 非 随 样本 容量 比例 增长 。AIC 信息 量 准 则 (Akaike information eriterion ) 
也 是 权衡 所 估计 模型 的 复杂 度 和 此 模型 拟 合 数据 的 优良 性 的 一 种 标准 。 在 
一 般 的 情况 下 ，AIC 可 以 表示 为 AIC =2r -2ln LL。 在 AIC 准则 下 ， 通 常 选择 
模型 应 是 AIC 值 最 小 的 那 一 个 。 

一 定 要 注意 ， 通 过 严格 的 计算 选择 模型 的 评分 法 ， 得 到 的 结果 并 不 一 
定 一 致 。 这 时 ， 必 然 要 通过 主观 判断 来 决定 最 终 的 选择 。 

【 例 10 -13】 请 比较 韦伯 分 布 和 指数 分 布 哪个 更 适合 于 描述 例 10 -2 
中 的 数据 。 

解 : 对 例 10 -2 中 的 数据 分 别 计 算 指 数 分 布 和 韦伯 分 布 的 列表 中 统计 
量 的 值 ， 相 应 的 计算 结果 见 表 10 -12 (在 50 处 截断 )。 


























表 10 -12 例 10 -13 数据 不 同 评 分 方法 的 计算 结果 
标 准 指数 分 布 韦伯 分 布 
K-S 值 0. 1340 0. 0887 
A-D 值 0. 4292 0. 1631 
刀 值 1. 4034 0. 3615 
P 值 0. 8436 0.9481 
极 大 似 然 值 - 146. 063 -145. 683 








对 于 以 上 的 结果 ， 可 以 发 现 韦伯 分 布 都 有 一 定 的 优势 。 因 此 在 备 选 模 
型 为 指数 分 布 和 韦伯 分 布 时 ， 我 们 理应 选择 韦伯 分 布 。 

【 例 10 -14】 我 国 某 保险 公司 1996 年 的 35 072 辆 投保 车 辆 索赔 次 数 
统计 结果 如 表 10 -13 第 1、2 列 所 示 。 试 分 析 索 赔 次 数 的 分 布 。 


解 : 首先 可 以 按照 近似 公式 


(4.3.20) 计算 


3 列 所 示 )， 
10 -8。 


的 值 (如 表 4 -3 第 


Ril 


然后 绘 出 其 图 形 ， 见 图 
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表 10 -13 车 辆 索赔 
次 数 数据 


ms 
索赔 次 数 | 保单 数 内 | 一 
RE 一 1 


0 27 141 


比值 
100 





一 一 急 一 一 外 ~ 
__e--e--® 


nr 


的 曲线 





图 10-8 函数 天 


Mil 


1 5 789 4.69 
之 1 443 8.02 
3 457 9.47 























35 072 


从 图 10 -8 中 可 以 看 出 ， 除 了 上 =7 这 个 点 之 外 ， 其 余 各 点 近似 旦 一 条 
直线 ， 并 且 斜 率 为 正 ， 因 此 可 以 考虑 用 负 二 项 分 布 来 拟 合 索赔 次 数 。 当 然 ， 
斜率 为 正 也 必须 通过 假设 检验 才能 确定 。 我 们 初步 判断 可 以 采用 负 二 项 分 


布 拟 合 ,， 但 是 不 能 排除 泊 松 分 布 。 因 为 直线 斜率 较 低 。 
首先 估计 泊 松 分 布 。 由 表 10 -13 的 数据 可 以 算出 样本 均值 和 方差 分 别 


是 xx=0.3176,， =0.4913， 以 样本 均值 作为 泊 松 分 布 的 参数 ,可 以 得 出 实 
际 观 测 数 和 拟 合 频数 的 比较 ， 如 表 10 -14 所 示 。 


实际 观测 值 和 用 了 (0.3176) 拟 合 结果 比较 






































表 10 -14 
车 辆 数 
索赔 次 数 观测 值 拟 合 值 误差 
0 27 141 25 528. 69 1 612.31 
1 5 789 8 107. 91 -2 318.91 
2 1 443 1 287. 54 155. 46 
3 457 136. 31 320. 69 
4 155 10. 82 144. 18 
5 56 0.69 55.31 
6 她 0. 04 26. 96 
7 2 0 2 
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一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 > 
续 表 
车 辆 数 
索赔 次 数 观测 值 拟 合 值 误差 
8 1 0 1 
9 1 0 1 
>10 0 0 0 
总 计 35 072 35 072 0 











其 次 ,采用 二 元 结构 模型 ， 用 两 个 泊 松 分 布 的 混合 再 次 拟 合 ,结果 见 
表 10 -15。 


表 10-1S ”实际 观测 值 、 利 用 一 元 结构 水 数 以 及 二 元 结构 烟 数 拟 合 结果 的 比较 
























































车 辆 数 
拟 合 值 误差 
索赔 次 数 
观察 值 N ~0. 8876P (0. 1719 ) 上 
N~P (0.3176) 一 元 结构 函数 | 二 元 结构 函数 
+0.1124P (1.4694) 
0 27 141 25 528. 69 27 120. 34 1 612.31 20. 66 
1 5 789 8 107.91 5 838. 70 -2 318. 91 -49.7 
2 1 443 1 287. 54 1 366. 37 155. 46 76. 63 
3 457 136. 31 501.74 320. 69 一 44.74 
3 
4 155 10. 82 177. 12 144. 18 —22.12 
5 56 0.69 51. 81 55.31 4. 19 
6 27 0.04 12. 68 26. 96 14. 32 
= 
7 2 0 2. 66 2 -0.66 
8 1 0 0.49 1 0.51 
9 1 0 0.08 1 0.92 
一 一 一 一 一 
>10 0 0 0.01 0 -0.01 
总 计 35 072 35 072 35 072 0 0 

















从 表 10 -15 可 以 看 出 ， 用 混合 泊 松 分 布 拟 合 的 误差 明显 降低 。 
最 后 ， 结 构 函 数 采用 伽 玛 苯 数 ， 参 数 分 别 为 w 和 9， 有 
E(N) = ag =% 
人 =ab+ap: =s’ 
因此 a 和 9 的 矩 估 计 值 分 别 为 : 
4 = 于 /[(s -x) =0.5807 
=(s* -元 ) /元 =0. 5469 
即 负 二 项 分 布 的 参数 估计 值 分 别 为 : 
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r=Q=0.5807 


=0.6464 


~ 


1+060 
再 次 拟 合 的 结果 见 表 10 -16。 





Ys 
外 


表 10 -16 实际 观测 值 、 利 用 一 元 结构 邯 数 、 二 元 结构 函数 以 及 









































伯 玛 结构 和 函数 拟 合 结果 的 比较 
车 辆 数 
索赔 拟 合 什 | 误差 
次 数 | 观察 值 N~P N ~0. 8876P (0.1719) N~NB 一 元 结 | 二 元 结 | 伽 玛 结 
(0. 3176) +0.1124P (1.4694) | (0.5807，0.6464) | 构 函 数 | 构 函 数 | 构 函 数 
0 27 141 25 528. 69 27 120. 34 27 223. o | 1 612. 31 20. 60 一 82 
1 5 789 8 107.91 5 838. 70 5 589.2 -2318. 91 一 49.7 199. 8 
2 1 443 1 287. 54 1 366. 37 1 561.8 155. 46 76. 63 ~118.8 
3 457 136. 31 501.74 475.0 320. 69 —44.74 18 
4 155 10. 82 177. 12 150. 3 144.18 | -22.12 | 4.7 
5 56 0.69 S51.81 48.7 55.31 4.19 7.3 
12. 68 26. 96 



































从 表 10 -16 可 以 看 出 ， 二 元 混合 泊 松 分 布 对 前 三 个 点 的 拟 合 效果 较 
好 ， 而 负 二 项 分 布 则 对 尾部 的 拟 合 效果 较 好 。 

【 例 10 -15】 表 10 -17 的 事故 数据 ， 总 共有 67 856 个 机 动车 事故 保 
单 。 试 选择 一 个 合适 的 分 布 描述 该 数据 。 





表 10 -17 机 动车 事故 保单 数据 
索赔 次 数 0 1 2 3 4 
频数 63 232 4 333 271 18 罗 


解 : 由 表 10 -17 可 以 看 出 ， 索 赔 次 数 的 分 布 比 较 集 中 ， 只 包括 0，1， 
2, 3, 4 五 种 情况 ,并且 索赔 次 数 为 0 次 的 保单 数 最 多 ， 占 总 保单 数 的 
93. 19% ; 而 且 索 赔 次 数 越 高 ， 保 单数 越 少 。 再 具体 研究 索赔 次 数 数据 的 特 
征 ， 几 个 相关 的 统计 量 如 表 10 -18 所 示 。 
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表 10 -18 索赔 次 数 的 相关 统计 量 
最 小 值 最 大 值 均值 方差 
0 4 0.07275701 0.07739737 


从 上 面 数 字 特 征 可 以 看 出 ， 索 赔 次 数 数据 的 方差 要 大 于 均值 ， 在 常用 
的 〈(a,，8，0) 分 布 类 中 ， 负 二 项 分 布 具有 这 种 人 性质 ， 而 且 负 二 项 分 布 具 有 
两 个 参数 ， 因 此 比 泊 松 分 布 在 拟 合 上 会 更 加 灵活 。 

通过 索赔 次 数 的 频数 表 可 以 看 出 ， 索 赔 次 数 为 0 次 的 保单 数 最 多 ， 占 
总 保单 数 的 93. 19% 。 考 虑 到 零 膨 胀 现 象 ， 因 此 下 面 对 零 点 的 概率 做 适当 的 
调整 ， 使 它 正 好 等 于 一 个 特定 值 ， 同 时 调整 其 他 非 零 点 上 的 概率 ， 使 所 有 
概率 值 和 等 于 1。 

表 10 -19 对 泊 松 、 负 二 项 、 堆 修正 的 泊 松 、 零 修正 的 负 二 项 作 了 综合 
的 比较 。 从 表 10 -19 中 可 以 看 出 ， 从 拟人 合 估 度 检验 的 p 值 来 看 ， 人 负 二 项 分 
布 的 效果 是 最 好 的 。 从 似 然 值 上 来 看 ， 零 修正 的 负 二 项 分 布 的 似 然 值 最 大 ， 
效果 有 一 定 提 高 。 但 是 从 SBC 准则 看 ， 负 二 项 分 布 是 最 优选 择 。 


















































表 10 -19 四 种 不 同 分 布 的 比较 
用 于 拟 合 的 分 布 
索赔 数 观测 值 
泊 松 负 二 项 零 修 正 的 泊 松 “| 零 修正 的 负 二 项 
0 63 232 63 094. 323 62 333. 100 63 230. 000 63 230. 000 
1 4 333 4 590. 544 4 321. 293 4 321.707 4 330. 303 
| 
2 271 166. 998 276. 273 286. 220 270. 228 
3 18 4.050 17. 209 12. 637 18.945 
4+ 2 0.075 1. 125 5. 436 6. 524 
r=1.1560670 r=0.4594147 
参数 A =0.072757 A =0.132457 
p=0.9407908 p =0.9144807 
x 177. 153919 0. 82193845 5.29 3. 1881106 
自由 度 3 2 3 2 
p 和 值 <0.01 0. 6630 0. 1520 0. 3635 
对 数 似 然 -18 101.5 —18 049. 68 -18 052. 2 -18 049.47 
SBC -18 107.1 —18 060.8 -18 063.3 —18 066.2 














1. 用 200 份 赔付 数据 拟 合 一 个 帕 累 托 分 布 ， 给 定 : 
(1) 对 应 的 极 大 似 然 估 计 是 人 =1.4 和 8=7.6; 
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(2) 以 极 大 似 然 估计 值 算得 的 对 数 似 然 阴 数值 是 -817. 92; 

(3) > ln(x, +7.8) = 607. 64。 
使 用 似 然 比 检 验 对 原 假设 a=1.5 和 08=7.8 进行 检验 。 

2. 表 10 -20 是 一 个 包含 15 个 损失 数据 的 样本 。 已 知 损 失 额 大 小 服从 
(0,，0) 区 间 上 的 均匀 分 布 。 记 ,是 第 j 个 区 间 上 的 损失 次 数 的 期 望 值 ，0， 


有 
是 第 j 个 区 间 上 损失 次 数 的 实际 观测 值 。 试 通过 最 小 化 > 


jt i 


来 估 


计 0。 
3. 假设 赔付 的 大 小 服从 指数 分 表 10 -20 


布 。 随 机 选取 5 个 赔付 样本 31、66、 _ 损失 额 大 小 所 在 区 间 | 观察 到 的 损失 值 








85、135、180。 使 用 短 估计 获得 指数 (0, 2] 5 
分 布 的 参数 。 求 对 应 的 Kolmogorov - (2, 5] : 





(5, %) 5 


Smirnov 检验 统计 量 。 
4. 将 365 天 每 日 观察 到 的 索赔 数 的 数据 汇总 如 表 10 -21 所 示 。 








表 10 -21 
每 天 索赔 数 0 1 2 3 44+ 
对 应 天 数 50 | 122 101 | 92 0 


首先 结合 以 上 数据 用 极 大 似 然 估计 拟 合 一 个 泊 松 模型 ， 然 后 将 数据 按 
照 每 天 索赔 数 重 新 分 为 4 组 : 0、1、2、3 +。 对 原 假 设 “ 索 赔 数 服从 泊 松 
分 布 ” 进 行 X 拟 合 优 度 检 验 ， 结 果 如 何 ? 

5. 给 定 以 下 包含 30 个 数据 的 汽车 索赔 人 额 数 据 ; 54、140、230、560、 
600、1 100、1 500、1 800、1 920、2 000、2 450、2 500、2 580、2 910、 
3 800、3 800、3 810、3 870、4 000、4 800、7 200、7 390、11 750、 
12 000、15 000、25 000、30 000、32 300、35 000、55 000。 原 假设 为 索赔 
额 的 分 布 服从 一 个 分 位 数 如 表 10 -22 所 示 的 连续 分 布 F(x)。 


表 10 -22 


x 310 500 2 498 4 876 12 930 
F (x) 0.16 | 0.27 | 0.55 0.81 090 | 0.95 


检验 时 在 保证 每 组 至 少 有 5 个 数据 的 前 提 下 分 成 尽 可 能 多 的 组 ,计算 
入 拟 合 优 度 检验 统计 量 。 

6. 设 用 来 拟 合 的 模型 是 正确 的 ， 则 当 样 本 量 逐 渐 增 大 至 无 穷 时 ， 玉 ol- 
mogorov 一 Smirnov 检验 统计 量 、Anderson - Darling 检验 统计 量 和 x 拟 合 优 度 
检验 统计 量 的 大 小 将 会 如 何 变 化 ? 
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7. 给 定 下 列 观测 值 的 一 个 样本 : 0.1、0.2、0.5、0.7、1.3。 为 了 检验 


对 应 的 概率 密度 函数 为 
4 
f(x) a x>0 


这 个 假设 ,计算 相应 的 Kolmogorov - Smirnov 检验 统计 量 。 

8. 设 原 假设 为 给 定 的 数据 来 自 一 个 已 知 分 布下 (x)， 如 表 10 -23 所 示 。 
求 相 应 的 x 拟 合 优 度 检 验 的 结果 。 

9. 来 自 服从 书 伯 分 布 的 总 体 的 样 





























表 10 -~- 23 
本 如 下 : 595、700、 789 、 799 、 一 一 
区 介 F(x;) 实际 观测 数目 
1109。 已 知 在 9 和 TT 的 极 大 似 然 估计 
x<2 0. 035 5 
点 ，> In (Kx )) =-33.05。 当 了 =2 7<v<5 0. 130 42 
时 ,909 的 极 大 似 然 估计 是 816.7。 用 似 5<x<7 0. 630 137 
然 比 检验 做 一 下 检验 H,: T=2, H,: 7 7<x<8 0. 830 66 
天 2。 求 检验 结果 。 8<x 1.000 50 
10. 观测 到 某 险 种 的 赔付 额 为 : 合计 300 
400、1 000、1 600、3 000、5 000、 
5 400、6 200。 假 设 数 据 服 从 08=3 300 的 指数 分 布 ， 过 p 一 p 图 和 D(x) 图 


A OY ED Os ON se pe 
(s—-t)—-D (3 000)。 

11. 来 自 总 体 球 的 包含 12 个 数据 的 样本 为 : 7、12、15、19、26、27、 
29、29、30、33、38、53。 用 于 拟 合 的 模型 是 参数 为 6=30 的 指数 分 布 。 
基于 上 述 数 据 画 出 p-Pp 图 ， 找 出 在 区 间 [0，1] 上 ， 该 图 像 与 y=x 的 图 


像 之 间 重 直方 向 上 的 最 大 离 差 (有 即 求 max 





Le 


12. 一 个 来 自 服从 参数 09=15 的 指数 分 布 的 总 体 的 祥 本 包含 8 个 数据 : 
3、4、8、10、12、18、22、35。 根 据 以 上 数据 ， 求 10 驳 显著 性 水 平 下 Kol- 
mogorov 一 Smirnov 检验 的 结果 和 和 10% 显著 性 水 平 下 Anderson - Darling 检验 
的 结果 。 

13. 一 组 保单 数 为 50 的 风险 集 的 索赔 数 以 如 表 10 -24 以 下 分 组 数据 形 
式 给 出 。 记 “ 乓 : 各 风险 的 索赔 数 服 从 0、1、2、3、4 上 的 离散 均匀 分 
布 ”。 
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(1) 使 用 xX 拟 合 优 度 检验 去 检验 这 个 原 假 设 ; 

(2) 将 2 个 相 令 的 组 合并 ， 则 哪 种 合并 方式 会 得 到 与 上 一 题 不 同 的 
结论 ? 

14. 使 用 参数 为 扩 =7 和 4=0.289 的 二 项 分 布 拟 合 上 题 数 据 ， 使 用 好 
拟 合 优 度 检验 去 检验 拟 合 的 优 劣 。 并 与 第 13 题 的 结果 进行 基于 卫 值 的 优 劣 
对 比 。 

15. 一 个 随机 抽取 的 样本 包括 100 个 数据 ， 用 指数 分 布 拟 合 时 ， 以 极 大 
似 然 估计 去 求 分 布 的 参数 ， 此 时 极 大 化 的 似 然 通 数 值 为 -159.4。 继 续 用 伽 
玛 分 布 拟 合 这 组 数据 ， 如 果 根 据 似 然 比 检验 ， 食 玛 分 布 的 拟 合 效果 在 5% 显 
著 性 水 平 下 优 于 指数 分 布 的 话 ， 则 用 极 大 似 然 估计 求人 徊 玛 分 布 模型 的 套数 
时 ， 最 大 化 的 似 然 函 数值 应 在 什么 范围 内 ? 

16. 一 个 来 自 总 体 下 的 样本 包含 12 个 数据 : 7、12、15、19、26、27、 
29、29、30、33、38 、53 。 


(1) 假设 数据 在 32 处 删 失 ， 并 使 用 参数 为 96=25 的 指数 分 布 拟 合 这 组 
数据 。 求 对 应 的 Kolmogorov -~- Smirnov 检验 统计 量 。 

(2) 使 用 参数 为 =30 的 指数 分 布 拟 合 这 组 数据 。 求 对 应 的 Anderson- 
Darling 检验 统计 量 。 

17. 40 个 损失 数据 以 千 为 单位 被 汇总 如 表 10 -25 所 示 。 

原 假 设 为 “损失 额 (以 千 为 单位 ) 
的 分 布 服 从 密度 方程 f(x) =x ,x>1”。 
对 原 假 设 进 行 X* 拟 合 优 度 检 验 ， 求 对 应 区间 《1 000) | 损失 数 | 区 间 总 损失 《1 000) 


表 10 -25 











检验 统计 量 的 大 小 。 (1, 4/3] 16 20 
18. 对 模型 A 和 B 进行 似 然 比 检 《32 | 时 ; 
(2, 4] 10 35 


验 。 已 知 A 是 单 参 数 模 型 ，B 不 止 一 个 
和 参数。 进行 完 参 数 舍 计 后 ， 两 模型 的 对 
数 似 然 涵 数 值 分 别 是 1 = -280 和 1 = 
-276。 如 果 检 验 的 结果 是 在 5% 显 著 ' 性 水 平 下 B 优 于 A,， 则 B 的 参数 最 多 
能 有 几 个 ? 











(4, m) 4 20 
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第 三 篇 ”模型 的 调整 和 随机 模拟 


第 十 一 章 修 匀 理论 





县 标 - 

口 了 解 修 匀 的 基本 原理 ,熟悉 拟 合 检 验 和 光滑 检验 的 几 种 度量 方法 

器 了 解 表 格 数 学 修 匀 的 常见 方法 ， 熟 练 使 用 MM 一 WW-A 修 匀 法 、Whit- 
taker 修 匀 法 和 Baysian 修 匀 法 来 修正 初始 估计 值 

口 热 秋 参数 估计 的 几 种 方法 ， 熟悉 分 段 参 数 修 匀 法 和 光滑 连接 修 匀 法 

口 能 够 灵活 运用 最 小 二 乘 修 匀 法 、 极 大 似 然 函数 法 、 样 条 修 匀 法 来 修 

正 初 始 估 计 值 


$1 信义 法 概述 


人 


本 书 的 前 面部 分 都 是 基于 概率 统计 的 ， 即 根据 观察 数据 ， 利 用 统计 方 
法 对 未 知 参数 进行 估计 ， 得 到 初始 估计 值 等 。 但 是 由 于 样本 信息 不 全 或 估 
计 方 法 不 科学 等 各 种 原因 ， 估 计 结 果 往 往 存 在 一 些 明 显 的 偏差 。 鲍 如 ， 一 
般 认 为 死亡 率 应 该 是 关于 年 龄 连续 递增 的 ， 但 是 在 估计 死亡 率 时 ， 对 每 个 
年 龄 阶段 的 死亡 率 是 单独 估计 的 ,很 有 可 能 会 出 现 死亡 率 不 满足 关于 年 龄 
递增 性 ， 而 且 得 到 的 是 一 个 个 离散 值 。 如 果 有 确切 的 理由 对 这 种 估计 表示 
怀疑 ,是否 可 以 根据 所 取得 的 估计 值 ， 获 取 更 合理 、 更 有 效 的 估计 ? 这 些 
都 是 修 匀 学 所 需 解 决 的 问题 。 

Miller 把 修 色 叙述 成 :“ 修 匀 是 这 样 一 种 可 靠 的 方法 ， 根 据 一 个 连续 变 
量 的 不 规则 的 观察 序列 ， 用 这 种 方法 ， 可 得 到 一 个 光滑 的 、 有 规则 的 修正 
序列 ， 与 观察 值 序列 相 和 和谐。”? 

为 什么 我 们 不 把 初始 估计 值 看 成 是 那些 要 去 估计 的 未 知 值 的 最 佳 估计 
呢 ? 如 果 我 们 采用 的 估计 过 程 是 合理 的 、 无 可 非议 的 ， 为 什么 还 要 去 改变 





@ 这 名 话 来 自 Dick London 著 、 徐 诚 尘 译 :《 修 匀 数 学 》， 上 海 科 学 技术 出 版 社 1996 年 版 , 第 1 页。 


那些 估计 呢 ? 答案 在 于 数据 本 身 。 每 个 初始 估计 值 都 是 某 个 特定 序列 的 一 
个 元 素 ， 在 这 些 元 素 之 间 我 们 怀疑 存在 某 种 很 强 的 关系 。 例 如 死亡 率 ， 我 
们 认为 它 应 该 是 关于 年 龄 的 连续 变化 、 递 增 的 光滑 曲线 。 而 在 大 多 数 情形 
下 ， 这 个 序列 的 每 个 元 素 是 彼此 独立 得 到 的 ， 也 就 是 说 ， 不 承认 “ 相 邻 变 
化 率 之 间 有 关系 ”。 而 当 我 们 修 匀 这 些 初 始 估计 值 时 ， 这 些 关 系 是 被 承认 存 
在 的 ， 且 被 反映 在 它们 的 修正 估计 上 。 因 此 ， 所 谓 的 修 匀 就 是 这 样 的 一 种 
过 程 ， 它 利用 某 种 先 验 信息 把 初始 估计 值 修正 为 新 值 ， 并 把 新 值 作 为 未 知 
真实 值 的 较 好 的 估计 。 

修 匀 在 精算 实务 中 一 个 重要 的 应 用 就 是 编制 生命 表 。 当 用 生存 模型 的 
理论 得 到 初始 生命 表 后 ， 这 些 序列 未 必 具 有 连续 变化 〈 光 滑 ) 、 递 增 等 体 
现 序列 内 在 联系 的 特点 ， 利 用 先 验 的 观点 一 光滑、 递增 ， 对 原 表 进行 修 
匀 后 ， 便 得 到 最 终生 命 表 。 

先 验 信息 在 本 章 中 主要 有 两 种 ,一 种 是 通常 的 物理 函数 都 具有 某 种 内 
在 联系 ， 如 函数 连续 、 一 阶 可 导 或 高 阶 可 导 (光滑 )、 递 增 等 ; 另 一 种 是 
先 验 的 统计 信息 ， 如 历史 上 已 经 得 到 的 关于 死亡 率 的 分 布 。 

为 了 严格 地 描述 修 匀 ， 引 入 下 列 符号 : 

下 标 〈 常 指 年 龄 ) ; 
待 估 参数 ( 常 指 死亡 率 ); 
t. 的 估计 量 ， 它 是 一 个 随机 变量 ， 当 它 作为 死亡 率 的 估计 量 时 ， 





和 





ts 


U, 





N 2 
可 表示 为 二 项 比例 一 ， 而 N, 服 从 参数 为 n, 和 i, 的 二 项 分 布 B (n,, 1,); 


有 =- 样本 容量 或 暴露 数 ; 
U, 的 实现 值 ， 是 i, 的 初始 估计 值 ; 
t, 的 修 色 值 ; 
VV 一 一 以 > 为 观察 值 的 随机 变量 ; 
w, 一 一 修 匀 表达 式 中 的 权 序 列 ; 
E, 一 一 估计 误差 随机 变量 ; 
E, 的 实现 值 。 
它们 的 一 般 关 系 为 : 
w, = 上 +e。 
U,.=t.+E, 
设 G 是 某 个 修 匀 过 程 〈 修 勺 算 子 ) ， 它 作用 在 初始 估计 序列 wx. 上 ， 我 
们 可 以 认为 c 分 别 作用 在 分 量 i, 和 e, 上 ， 它 保持 i, 分 量 基 本 上 不 变化 ， 而 
有 效 地 减少 误差 分 量 e.， 则 
v,=G(u,) =G(t,) +G(e,) =it,+e, 
其 中 e', = G(w,) -i 称 为 修 色 误差。 修 色 的 目的 就 是 使 |e',| < 1e,|， 从 而 








u 
x 





2:- 





e:。 


“231 ， 


"， 2532 。 


使 >. 较 wu, 更 接近 于 z。 


11.1.2 拟 合 检验 和 光滑 性 检验 

在 关于 修 匀 的 定义 中 ， 对 于 修 色 估计 值 ， 有 两 个 重要 的 要 求 : 首先 ， 
修 与 值 不 应 离 初始 (观察 ) 值 太 远 ， 即 这 两 者 之 间 应 有 一 定 的 拟 合 度 ; 其 
次 ,根据 先 验 假设 ,真实 序列 应 该 是 连续 变化 的 ， 所 以 修 匀 值 应 该 具有 一 
定 的 光滑 度 。 因 此 在 修 色 过 程 中 需要 对 修 色 结果 进行 拟 合 检验 和 光滑 性 

对 于 光滑 性 检验 ， 传统 的 方法 是 计算 这 些 修 匀 值 的 某 些 阶 的 有 限 差分 。 
当 那 些 差分 的 茶 个 阶 (最 常用 的 是 3 阶 和 4 阶 ) 是 “ 较 小 值 ” 时 ， 我 们 就 
认为 得 到 了 某 个 光滑 度 。 例 如 采用 5S = EA'w) 作为 光滑 性 的 一 个 度量 ， 
这 里 v, 是 指标 i 处 的 修 匀 值 。 这 种 光滑 性 度量 ,暗示 着 力求 使 修 勾 值 分 布 
在 一 条 三 次 曲线 上 。 当 然 ， 不 同情 况 下 的 光滑 度量 是 不 同 的 。 原 则 上 ， 这 
种 光滑 度量 应 符合 光滑 性 先 验 观点 。 

根据 拟 合 的 概念 ， 可 以 给 出 一 种 衡量 拟 合 程度 的 表达 式 : 

F, = >》 w,(v, — u,) (11.1.1) 

这 里 的 权 数 w, 所 反映 的 是 x 岁 的 样本 容量 〈 梭 露 数 ) 对 总 偏差 的 影响 ， 如 
w,=n, 或 w, =mA[Z， n,o Fh, i 说 明 拟 合 程度 越 好 。 然 而 式 
(11.1.1) 有 个 明显 的 缺陷 是 ， 当 正 或 负 的 加 权 偏 差 同时 出 现 但 相互 抵消 
时 ,一 个 很 粗 劣 的 拟 合 也 可 能 使 f=0。 鉴 于 这 一 点 ， 可 考虑 下 面 衡 量 拟 合 
程度 的 表达 式 : 





F, = 》 w, (os ~ wu,) (11.1.2) 
或 者 加 权 偏 差 的 一 阶 和 矩 的 和 
FF, = > xw, (2, — wu,) (到 


”尽管 F, 和 ,有 明显 的 缺陷 ,但 是 在 处 理 死 亡 数 据 时 ， 仍 经 常 被 使 用 ， 
这 是 因为 它们 有 如 下 的 直观 含义 : 车 t. 表示 真实 死亡 率 ， 且 w, =n,， 则 
w,* 4, 是 x 岁 的 观察 死亡 数 , w.' v, 是 修 匀 死亡 数 ， 那么 》xw,* w, 是 观察 
总 死亡 年 龄 。 类 似 地 ，》 xw,* z. 是 修 色 总 死亡 年 龄 。F, 较 小 就 说 明 观 察 死 


亡 人 数 接近 修 匀 死亡 人 数 ，F, 较 小 就 说 明 总 的 观察 死亡 年 龄 接近 总 的 修 义 
死亡 年 龄 。F, 或 f, 越 小 ， 则 死亡 修 匀 值 越 能 更 真实 地 反映 经 验 生 命 变化 
规律 。 
在 电 修 匀 值 和 初始 值 之 间 的 偏差 组 成 的 序列 中 , 还 可 根据 其 正 负 符号 
个 数 和 模式 确定 拟 合 度量 。 这 是 一 个 相当 简单 但 十 分 有 用 的 方法 。 定 义 
d, =v, 一 2 (11.1.4) 


从 直观 上 可 以 看 出 , 如 果 d. 的 符号 经 常 改 变 ， 意 味 着 修 匀 序列 与 初始 
估计 序列 上 下 交错 ， 而 不 是 一 方 总 在 另 一 方 的 上 方 或 下 方 。 进 一 步 地 ， 如 
果 估 计量 U, 是 一 个 二 项 比例 ， 那 么 观察 (初始) 估计 值 等 可 能 地 出 现在 
U, 的 上 方 或 下 方 。 又 由 于 U, 的 中 位 数 与 其 均值 i, 非常 接近 ， 如 果 vw, 是 
的 最 佳 佑 计 ， 则 zx. 出 现在 v, 的 上 方 或 下 方 的 可 能 性 大 臻 相等。 因此 d, 出 
现 正 号 或 出 现 负 号 的 可 能 性 大 臻 相等。 

各 个 不 同 的 U, 之 间 的 独立 性 假设 隐 仿 着 d 与 di ,的 符号 是 相同 的 或 相 
反 的 可 能 性 是 相等 的 。 因 此 ， 从 4,., 到 dj 符 号 改变 的 概率 是 1/2。 如 果 共 有 
n 个 d， 则 总 序列 1d,| 符 号 改变 的 个 数 服 从 二 项 分 布 B(n -1,1/2)， 符号 改 
变 的 个 数 的 期 刻 值 为 (n -1)/2。 所 以 如 果 修 人 色 值 与 初始 估计 值 拟 合 得 很 好 
时 ， 则 {di 的 符号 改变 频繁 ， 接 近 n/2 次 。 


11.1.3 修 色 方法 的 分 类 

本 章 主要 讨论 两 类 修 匀 方法 : 假设 真实 的 函数 是 -f(x; ce) ， 其中。 
是 未 知 参数 ， 如 果 已 知 初始 估计 值 序列 w,， 则 

第 一 种 方法 是 表格 数据 修 匀 。 这 种 方法 是 直接 对 所 获取 的 表格 (或 离 
散 ) 数据 进行 修 匀 ， 即 直接 去 找 一 个 函数 GE, 用 w = 6 (w,) 作为 4 新 的 舍 
计 值 。 

第 二 种 方法 是 参数 修 匀 。 这 种 方法 是 先 去 估计 参数 <， 再 将 。 的 估计 值 
e (w,) 代 人 函数 /中 ,用 w =f (x; e (w,)) 作为 上 新 的 估计 值 。 所 以 参 
数 修 匀 是 间接 的 ， 而 且 必 须要 知道 画 数 了 的 参数 表达 形式 。 


11 2 表格 数据 修 和 


11.2.1 移动 加 权 平 均 修 义 (M- 双 一 A) 

移动 加 权 平 均 修 义 (M-W-A) 是 发 展 较 早 的 方法 ， 它 使 用 方便 ， 在 
没有 计算 机 的 年 代 比 较 流 行 。M -W -A 认为 修 义 值 是 一 组 连续 的 、 确 定 个 
数 的 未 修 匀 值 〈( 观 察 者 或 初始 估计 ) 的 一 个 加 权 平 均 。 

1. 基本 表达 式 。 


3 Cy 


显然 ， 每 一 个 修 匀 值 都 是 由 2n +1 个 连续 初始 估计 值 确定 的 。 为 方便 
起 见 ， 称 2n+1l 为 该 M- 允 -A 的 修 匀 幅度 。 
若 c.=a,，r=1，2，3，…， 只 ， 则 称 式 (11.2.1) 为 对 称 M- 双 一 人 A 


“ 253， 
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“254 


为 了 降低 系数 a, 的 确定 难度 ， 本 章 仅 限于 讨论 对 称 M -WA 公式 。 
如 无 特别 说 明 ， 本 教材 中 提 到 的 M -W -A 公式 都 是 对 称 的 。 

由 于 式 (11.2.1) 是 中 心 对 称 (rr 从 -nn 到 nn)， 这 便 出 现 了 “ 端 值 ” 
问题 ， 即 如 果 vv 和 uw, 分别 是 具有 最 大 和 最 小 指标 的 u,， 则 根据 式 
(11.2.1), 具有 最 大 和 最 小 指标 的 修 匀 值 分 别 是 v,,, 和 wv,.,， 而 不 是 v 
和 wo 

2. 再 生性 。 修 匀 的 目的 是 使 估计 值 尽 可 能 地 靠近 其 真实 值 。 如 果 估 计 
值 碰巧 是 真实 值 ， 则 一 个 好 的 修 匀 公式 应 使 得 修 匀 的 结果 仍然 是 真实 估计 
值 ， 即 


t, = at (11.2.2) 


这 里 我 们 将 这 一 性 质 称 为 修 匀 表达 式 的 再 生性 。 

实际 的 情况 是 真实 值 i. 并 不 知道 ,但 是 我 们 可 能 获得 i, 的 项 数 类 型 的 
某 些 先 验 信息 ， 这 时 可 通过 式 (11. 2.2) 来 确定 ww。 

命题 让 -1 若是 x 三 次 多 项 式 ,， 则 再 生性 条 件 式 (11.2.2) 等 
价 于 


by (11.2.3) 


或 者 cu +2》 a,=1,，, ra, = 0 11.2.4 


证 明 : 设 ti=co+cx + CX” 十 Ci (cs 关 0)， 则 式 (11. 2.2) 可 表示 为 : 


Co + CX + CX + 
a n a 
二 oa >》 a, toy, Qa.(x +r) +c >》 a, (x +7)’ + 6 >》 a, (x +r)’ 
pk eh Pe i 


= ND a,) + 好 .ce 人 by a ) st Q,) +36, 3 rao,] 到 a, ee ra, 


(其 中 第 二 个 等 式 用 了 对 称 性 ) 
比较 三 次 项 的 系数 知 > o, = 1 。 比 较 一 次 项 的 系数 ， 并 注意 到 c, 了 0， 


知 六 ro = 0 故 式 (11.2.3) 成 立 。 由 对 称 性 可 知 式 11.2.4) 成 立 。 

很 多 物理 曲线 都 符合 或 可 近似 为 多 项 式 mw + ax + cz + cy， 所 以 实际 
中 常 被 假设 符合 三 次 多 项 式 ， 因 此 式 (11.2.3) 也 常 作为 再 生性 条 件 的 
等 价 形式 。 / 

3. 误差 分 析 。 

设 0,=t,+E,， 令 WV.=C(U,) 为 修 匀 变量 ，E; =C(E.)， 则 


区 = G66) +E = 》 ob +E, = alt,+Ek,,,) (11.2.5) 


根据 再 生性 ， 若 E(E.) =0， 则 E(V.) =t,，E(E,) =0。 这 说 明 如 果 初 
始 估计 值 U, 是 六 的 无 偏 估 计 ， 则 修 匀 量 V. 也 是 i. 的 无 偏 估 计 。 那 么 ，YV. 
作为 i. 的 估计 量 要 优 于 U,， 究 竞 体现 在 何 处 ? 这 便 是 V. 较 U, 更 “稳定 ”。 
这 种 稳定 性 体现 之 一 就 是 Var(V,) 小 于 Var( U,)。 

或 者 说 ，Rs - 7 的 值 越 小 ， 7. 较 U0, 就 越 优 。 


若 假 设 {E,,,| 相互 独立 且 方 差 均 为 oo。， 则 


, Var(V,) Var(V.) Var( 3 aU,,,) ee es 
oT Yar(U) Var(E) ™ 7 a -2.6) 











在 公式 (11. 2.3) 的 条 件 下 ，minRs 便 可 确定 c,。 此 时 得 到 M -到 一 AA 
公式 为 使 R, 最 小 化 公式 。y = (R) "' 称 为 M -W -A 公式 的 权重 。 
进一步 ， 如 果 假 设 i 是 x 三 次 多 项 式 ， 再 生性 条 件 为 


yb (11.2.7) 
由 最 优化 理论 知 ， 拉 格 朗 日 乘 子 可 表示 为 : 
A ED (11.2.8) 


所 以 可 得 2 =2a, -A -pr =0, 即 有 
ao = 本 AT (11.2.9) 
将 式 (11.2.9) 代入 式 (11.2.3) ， 得 : 


a(2n +1) +26> "=1 
正安 导 


六 = 0 
其 中 a = 分 ,5b= 华 ,求解 此 方程 组 并 代入 式 (11.2.9)， 得 : 


_ 3(3n’ +3n-1)~15r 
"(2n -1) (2n+1)(2n +3) 国 





a 


11.2.2 Whittaker 修 色 


Whittaker 修 匀 于 1923 年 开始 形成 和 发 展 ， 其 基本 思想 源 于 对 修 匀 结果 
的 光滑 与 拟 合 要 求 。 | 

1. 基本 表达 式 。Whittaker 修 匀 由 两 部 分 组 成 ， 一 部 分 是 拟 合 度量 算 
子 ， 另 一 部 分 是 光滑 度量 算 子 。 表 达 式 如 下 : 


M=F+hs -= S 一 1h A’v_]’ 11. 2.10 
> w, (v, - w,) 之 站 2 ] ( ) 


w= 


25335 
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上 式 中 拟 合 度量 算 子 下 = 》w, ("。 - 4) 类 似 最 小 二 乘法 的 思想 。z。 


为 权重 ， 往 往 确定 为 ;CT 7 或 二 ， 其 中 元 是 n, 关于 所 有 x 的 算术 平均 。 


这 主要 是 为 了 体现 观察 死亡 人 数 与 修 匀 死亡 人 数 的 差别 。 光 滑 度 量 算 子 是 


eh de si nd ni 
导数 来 衡量 的 ， 可 导 阶 数 越 高 曲线 越 光 滑 ， 而 差分 运算 和 求 导数 是 对 应 
所 以 差分 的 阶 数 越 高 对 光滑 性 要 求 也 就 越 高 。 参 数 h 是 一 个 权重 ， A 
合 和 光滑 性 之 间作 了 一 个 平衡 。 
值得 注意 的 是 ,在 式 (11.2.10) 中 , 下 标 x=1 表示 第 一 个 最 小 年 龄 ， 
x =n 表示 最 后 一 个 最 大 年 龄 。 最 小 、 最 大 年 龄 到 底 是 多 少 ? 这 取决 于 所 考 
虑 的 问题 本 身 。 
通过 最 小 化 M， 可 确定 修 勾 值 v,。 这 实际 上 是 一 个 无 约束 的 二 次 优化 
问题 。 可 以 证 明 ， 使 式 (11.2.10)〉 极 小 化 的 修 匀 和 值 w 必 自 动 地 使 拟 合 度 
量 F = 了 wl(v, -wu),F = Dxw,(v, -wv,) 为 零 。 
因此 ， 对 死亡 数据 而 言 ， 取 w, =n, 时， 有 
2% nv 二 > nu,, > Xnv, = > 7 
这 说 明 ， 对 观察 数据 x. 和 修 匀 数据 v, 来 说 ,死亡 总 人 数 是 相等 的 ， 死亡 总 
年 龄 也 是 相等 的 。 
2. M 的 极 小 化 。 显 然 ，M 是 nn 个 未 知 值 v 的 一 个 函数 ， 因 而 ， 极 小 化 
M 的 wv, 是 以 下 nn 个 方程 的 解 : 


aM _ 
ov, 


虽然 用 这 种 标准 计算 技巧 可 以 求 出 M 的 极 小 值 ， 但 是 我 们 这 里 介绍 另 
一 种 方法 解决 极 小 化 问题 ， 那 就 是 应 用 关于 M 的 一 种 矩阵 一 向 量 公 式 。 用 
y "表示 矩阵 y 的 转 置 。 令 


r=1,2,.,n (11.2.11) 


u = [wu,w,,,u,], M4 cs 
201 0 
202 
w= 
0 20 


则 F= (v-u)w(v-a)。 
为 了 用 和 矩阵 表示 hS， 考 虑 展 式 
(1 =1 Cr1GCN CC (11.2. 12) 
矩阵 KK, 为 (za -zz) xz 矩阵 ， 其 元 素 按照 下 面 的 方式 确定 : 


(1) 车 z 为 偶数 ，K, 的 第 一 行 中 前 z+1 个 元 素 恰 为 式 (11.2.12) 中 
的 z+1 个 系数 , 后 n-z+1 个 元 素 为 0。 第 二 行 元 素 是 将 第 一 行 右 移 一 格 
得 到 。 被 挤 出 的 一 个 0 放 到 前 面 去 。 用 类 似 的 方法 可 得 其 余 各 行 元 素 。 

(2) 车 z 为 奇数 ， 则 K, 的 第 一 行 中 前 z+1 个 元 素 恰 为 式 (11.2.12) 
中 的 z+1 个 系数 的 相反 数 ， 后 n -z+1 个 元 素 为 0， 其 余 各 行 元 素 仍 按 上 
述 右 移 方法 得 到 。 

(3)hS=h(K,v)'(K,v)。 

【 例 11 -1】 分 别 在 下 列 情形 下 ， 求 矩阵 区 及 3 的 形式 : (1) z=2， 
n=6; (2) z=3, n=7。 

解 : (1) 2 阶 差分 算 子 可 以 通过 矩阵 表达 为 : 


1 -2 1 0 0 0 
0 1 -2 1 0 0 
K, = 
0 0 1 2 ,0 
0 0 0 1 | 
Kv=[Aw, A’v,, A’v,, A’w,] 


S=(Kv)'(Kv)=v'(K’,K,)v-= FLEAw.] 
—1 3 一 3 1 0 0 0 
0 -1 3 一 3 1 0 0 


2) K., = 
SC .0 0 -1 3 -3 1 0 
0 0 0 —1 3 -3 1 
可 知 5 入 > (A'w.)’ a v'(K'K,)vo 国 
不 难 验 证 ， 如 此 定义 的 有 K, 为 ma-z 维 列 向 量 ， 其 元 素 恰 为 A'v,，A’y,， 
AV, ,o 
最 后 ， 显 然 有 WM 的 如 下 和 矩阵 形式 : 
M=(v-u)w(v-u) +hv'(K',K,)v (11.2.13) 


了 





根据 式 〈11.2.11)， 极 小 化 M。 令 人 = [3 ，…,3。 | ,由 号 -0， 得 线性 
方程 组 
[w+hK'‘K,lv=wu 或 cv=wu (11.2.14) 
这 里 ，c =w +hK'K,。 若 c 为 非 奇 异 和 矩阵 ， 则 
v=c wu 


这 一 部 分 实际 上 只 是 用 和 矩阵 的 算法 求解 优化 问题 (11. 2. 10)。 


11.2.3 二 维 Whittaker 修 匀 
前 面 所 讨论 的 修 匀 都 是 一 维 序列 的 修 义 ， 修 匀 序 列 的 下 标 是 一 维 的 ， 
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如 死亡 年 龄 。 但 在 精算 实务 中 ， 人 往往 碰 到 待 修 义 数据 的 下 标 是 二 维 的 。 倒 
如 ， 在 选择 一 终极 寿命 表 中 ， 一 个 下 标 变量 是 选择 年 龄 (投保 年 龄 ) ， 用 
[x] 表示 ， 另 一 个 下 标 变量 是 从 选择 年 龄 开始 的 保障 期 ， 用 > 表示 。 因 此 
qiw ,表示 选择 年 龄 为 x 岁 、 满 x%+r 岁 后 一 年 内 死亡 的 概率 。 沿 用 本 章 的 记 
号 ， 用 Ui,,, 表 示 初 始 估 计量 ，ii,,, = 91w,, 表 示 真 实 死亡 率 ，ni,,, 表 示 暴 露 
数 ，v1,,, 表 示 修 色 值 。 初 始 的 修正 受 着 关于 阵列 ti,j,, 的 先 验 观点 的 指导 ， 
而 且 这 些 先 验 观 点 还 包括 着 光滑 性 要 求 ， 同 时 要 设法 保持 对 于 观察 数据 的 
某 种 拟 合 度 。 

在 选择 一 终极 寿命 表 中 ， 下 标的 二 维 性 不 仅仅 表现 在 选择 年 龄 ， 还 有 
死亡 年 龄 对 死亡 率 产 生 的 影响 。 例 如 13 < tl ， 也 就 是 说 ， 投 保 年 龄 为 
35 岁 的 人 一 年 内 的 死亡 率 比 一 个 35 岁 但 已 投保 两 年 的 保 户 一 年 内 的 死亡 率 
小 。 一 般 地 ， 较 小 的 mm 有 ,<t niie 但 是 ， 实 践 表 明 ， 随 着 时 间 
推移 ， 选 择 年 龄 对 死亡 率 的 效用 就 减少 了 ， 最 后 完全 取决 于 死亡 年 龄 。 选 
择 年 龄 对 死亡 率 产生 作用 的 年 限 则 做 选择 期 ， 超 过 选择 期 后 的 死亡 率 叫 做 
终极 死亡 率 。 如 车 选择 期 为 k,， 则 i ,=i,,，(T 宇 上 )。 

为 了 方便 起 见 ， 选 择 一 终极 表 用 表 11 -1 说 明 ， 其 中 用 的 是 我 们 要 估 
计 的 真实 死亡 率 。 我 们 任意 选择 一 个 选择 期 限 k=4。 


表 11 -1 选择 一 终极 表 形 式 
死亡 率 
选择 年 龄 [x] 选择 经 过 的 时 其 终极 死亡 率 ”| ”到 达 年 龄 
J 2 4 





30 tr30] t[30] + t[30] +2 t[30] +3 134 34 





31 t131] t[31] +1 tr31] +2 ![31] +3 tas 35 





32 tr32] t[32] + t[32] +2° £[32] +3 ta6 36 


- 





33 t[33] t[33] + £[33] +2 £133] +3 t37 37 























关于 这 组 数据 的 先 验 观点 除了 在 每 一 横行 和 每 一 竖 列 满足 光滑 性 外 ， 
还 有 单调 性 要 求 ， 即 关于 死亡 率 的 递增 或 递减 模式 的 先 验 观点 。 对 于 保险 
数据 ， 在 每 一 列 中 ， 死 亡 率 是 递增 的 。 因 为 随 着 选择 年 龄 的 增加 ， 而 从 选 
择期 开始 保障 期 限 都 是 相同 的 ， 所 以 死亡 率 是 递增 的 。 同 样 ， 在 每 一 行 中 ， 
死亡 率 是 递增 的 ， 因 为 年 龄 和 自选 择期 的 保障 期 都 在 增加 。 进 一 步 ， 在 以 
下 这 种 对 角 线 上 上， 死亡 率 也 是 递增 的 。 这 些 对 角 线 是 从 和 矩阵 的 左下 到 右上 ， 
在 同一 条 这 种 对 角 线 上 ， 每 个 人 的 到 达 年 龄 都 是 相同 的 ,但 自选 择期 开始 
的 保障 期 限 却 是 递增 的 。 因 而 可 以 认为 : 


Vas) < braayrl < 71331+2 Sar3 < tr < tas 


这 些 先 验 观 点 : 光滑 性 和 上 述 三 个 方向 的 死亡 率 的 递增 性 ， 再 加 上 拟 
合 性 都 是 我 们 在 修 匀 过 程 中 需要 考虑 的 。 

在 上 面 的 叙述 中 ,死亡 率 随 保障 期 的 增加 而 增加 ， 这 是 正 选择 的 情形 。 
与 此 相反 ， 对 于 医疗 临床 数据 ， 同 一 年 龄 的 死亡 率 都 是 保障 期 的 减 函 数 ， 
这 是 负 选 择 的 情形 。 例 如 ， 投 保 的 原因 是 需要 治疗 的 一 种 特殊 的 疾病 或 者 
要 做 某 个 外 科 和 手术。 此 时 ， 在 选择 以 后 很 得 的 时 间 内 ， 期 望 死亡 率 是 很 高 
的 ， 而 只 有 在 治疗 成 功 而 继续 生存 的 情况 下 ， 死 亡 率 将 逐渐 减少 。 在 这 种 
情况 下 ， 每 一 行 中 的 死亡 率 应 该 是 递减 的 ， 而 且 在 左下 到 右上 的 对 角 线 上 ， 
死亡 率 也 是 递减 的 。 

由 于 数据 是 二 维 的 ， 所 以 它 相 当 于 一 个 曲面 。 如 果 利 用 Whirraker 修 勾 
的 思想 ， 则 需要 定义 垂直 光滑 度量 和 水 平 光 滑 度量 ， 再 连同 拟 合 度量 一 起 ， 
组 成 它们 的 线性 组 合 ， 再 通过 极 小 化 这 个 组 合 度量 找 出 修正 估计 阵列 。 

假设 有 m xz 个 初始 估计 值 wj,i=1,2,…,m;j=1,2,-…,no。 这 里 m 为 
选择 年 龄 ，n -1 为 选择 期 。 于 是 每 个 i， 有 n -1 个 选择 死亡 率 ， 一 个 终极 
死亡 率 。 此 时 的 拟 合 度 量 为 : 


Fs= ST wv -oo (11.2.15) 
光 渭 性 分 别 从 垂直 与 平行 两 个 方向 得 到 。 设 ^- 为 垂直 方向 差分 算 子 ， 





4A’ 为 水 平方 向 差分 算 子 ， 则 第 j 列 的 垂直 光 消 度量 为 by (4w) , 总 的 垂直 
光滑 度量 为 


"9 = 5 7 (4 op) (11.2.16) 
类 似 地 ， 总 的 水 平 光 滑 度量 为 : 
‘S = 了 了 (Ar (11.2.17) 
于 是 ， Whimaker 修 匀 算 子 为， 
M = 下 +a:S+B…S (11.2.18) 


为 了 完成 歼 的 极 小 化 ， 把 M 写成 矩阵 形式 。 

1. FF 的 于 阵 形式 。 将 (uw)。,., 排 成 mn xl 列 向 量 ， 先 排 第 1 行 ， 再 排 
第 2 行 ， 依 次 进行 下 去 ， 则 wy 变 成 wu-ubvwe 把 这 个 列 向 量 记 为 u， 修 匀 向 
量 记 为 v。 

将 权 和 矩阵 (zw ) 。 变 成 mn x mn 对 角 阵 。 方 法 是 将 权 和 矩阵 各 行 元 素 逐 一 
放 在 主 对 角 线 上 ， 则 w; 变 成 wo ,wini-v1;， 把 这 个 对 角 阵 记 为 w。 

下 的 和 抢 阵 形式 可 表示 为 : 

F=(v-u)’'w(v-u) (11.2.19) 
2.°S 的 给 阵 形式 。 定 义 m(n-y) xm 和 矩阵 ， 记 为 " 政 ,， 使 得 * 政 ,y 包 含 


”259 . 


精算 模型 


* 260 . 


的 m(n -YY) 个 元 素 A?um 的 次 序 正好 与 式 〈11.2.17) 相同 ， 则 
“SS= (*"K,v)’' (’'K,v) (11. 2. 20) 
矩阵 * 区 ,可 按 如 下 方法 得 到 : 
(1) 按照 一 维 Whirraker 修 匀 的 方法 ， 将 v 换 成 矩阵 U = (w,),., 的 第 1 
行 元 素 ， 得 到 的 矩阵 记 为 ; 玫 ,; 类 似 地 ， 再 换 成 T 的 第 2 行 元 素 ， 得 到 的 矩 
阵 记 为 ;:K,， 依 次 继续 下 去 ， 最 后 "KK,。 它 们 都 是 (n -y) xz 矩阵 。 


(2) 令 
'K, 
h 
“K, = 2K, 
"K, 
容易 验证 它 符 合 上 述 要 求 。 


3. "5 的 适 阵 形式 。 定 义 n(m--z) xmza 和 矩阵 ' 必 .， 使 得 
"S$S=("K,v)’'(K,v) 
极 小 化 M 后 ， 得 方程 组 
(w+o'K’'K,+BK’K,)v=wu 
【 例 11 ~2】 已 知 观察 值 U 和 修 勾 值 V 分别 如 下 : 
1 1 6 2 3 5 
Sle 4 ol Vl 5 | 
并 且 知 道 : 
(1) 所 有 的 权 数 都 等 于 2; 


(2)F = > 2 wal ws 一 wy) 


(3) 垂直 光滑 度量 'S 和 水 平 光 滑 度量 "S 都 采用 一 阶 差 分 ; 
(4) M=F+2'S+"S, 


求 M。 
解 : 
3 = > > (Cao 四 > (Am 六 = (3-2) +(5-3) +(6-5) =6 
兴安 > > (Am) = (3-2)* +(5-3) +(5-3) +(6-5) =10 
F= > Y2(w -v5) = 14 
则 Pp 


11.2.4 Baysian 修 勾 


ea my ee te 


Baysian 修 匀 与 数理 统计 中 的 Baysian 估计 十 分 相似 。 下 面 将 对 这 种 方 
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法 进行 简单 的 描述 。 

就 像 Baysian 估计 一 样 ，Baysian 修 义 按 如 下 四 个 步骤 进行 : 

(1) 确定 i, 的 先 验 分 布 。 设 7 为 一 个 连续 型 向 量 , i, 是 随机 变量 7 的 
一 个 观察 值 。 其 先 验 密度 为 万 (:) 。 

(2) 确定 实验 模型 。 所 谓 实 验 模 型 ， 就 是 估计 量 U 的 条 件 密度 ， 记 为 
for (alt)。 

(3) 确定 后 验 分 布 。 这 就 是 在 已 知 样本 的 前 提 下 7 的 分 布 : 

fro (ult) -A (11.2.21) 

(4) 修 匀 值 v. 的 确定 。w, 是 i 的 最 佳 估 计 ， 若 这 种 最 佳 的 衡量 标准 是 
均 方 误差 最 小 的 话 ， 则 该 值 应 为 了 关于 忆 条 件 期 望 ， 即 V=E(T|U) 。 

【 例 11 -3】 将 一 枚 硬币 上 抛 n 次 ， 记 其 正面 出 现 的 次 数 为 及， 试用 
Baysian 修 义 ， 确 定 其 正面 出 现 的 概率 1 [已 知 上 的 先 验 分 布 为 B (a,，b)]。 

解 : (1) 先 验 分 布 。 





f(t) Se 1)"'， 0<t<1, a>0, b>0 为 参数 
(2) 实验 模型 。 互 的 分 布 律 为 : 

PriC(h|i) = Cr (1 一 划一， h=0, L233 
五 的 边缘 分 布 律 为 : 


a _ IT(a+6b). + ,Tla+h)T(b+n-h) 
Pilh) = 人 Por( | fl) de = FATE 人 Te 


(3) 后 验 分 布 。T 的 后 验 密 度 为 : 
Pur(h |2) “fr(t) T(a+t+b+n) 





即 为 贝塔 分 布 B (a+h, b+n—-h)。 
(4) 确定 修 匀 值 。 
a+t+h a . a+b hk n 


v=E(T|H) = 一 一 一 -= 


全 十 
C++P atb atb+n nn CC+p+D 











(11.2.22) 


式 (11.2.22) 说 明 修 匀 值 正 是 先 验 估计 值 





与 后 验 估计 值 二 的 加 权 


a 
a+b 


平均 ， 权 数 分 别 是 -<+? 及 


a+b+n ‘ag+b+t+n” 








下 面 介 绍 两 种 常见 的 Baysian 修 义 。 

1. Kimeldorf - Jones 方法 。 该 方法 是 一 种 特殊 的 Baysian 修 匀 ， 该 方法 
其 实 就 是 在 先 验 分 布 为 多 维 正 态 分 布 情形 下 的 Baysian 修 匀 。 

(1) TT 的 先 验 分 布 。 若 先 验 分 布 是 一 维 正 态 分 布 ， 则 其 密度 函数 可 表 
示 为 : 


fr(t) = (27a) 到 ”exp -Fe (tm)’] 
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这 里 ，m 是 均值 ，a 为 其 方差 。 
车 先 验 分 布 为 n 维 正 态 分 布 ， 则 其 联合 分 布 密度 函数 为 : 


f(D [C27n)° IA ST. exp -F(t-m) A (tm)] 


这 里 t= (6,… ,ti )'"，m = (mi ms) 为 其 均值 向 量 ，A 为 其 协 方差 
矩阵， 和 且 A 是 对 称 正定 矩阵 。 
(2) 实验 模型 。 在 T 已 知 的 情况 下 ，U 的 条 件 密 度 可 表示 为 : 


Ar(alb =[(2z) | BI exp| -二 Ca-b7B Ca-g9] 


这 里 , & = (vw,…,w,)'，B 为 协 方差 矩阵 ， 且 是 对 称 正定 矩阵 。 
(3) 后 验 分 布 。 在 口 已 知 的 情况 下 ,TT 的 后 验 密 度 为 : 


frult | 1) =hemf -tm) A (tm) + (ub)'B Ca-b]] 


=hexp| -于 (tc CGt-V] 


v=(A +B ) "(Bu+t+A m) (11.2.23) 
C=(A +B ) 
这 里 k, ，k, 分 别 是 不 含 i 的 确定 系数 。 

(4) 确定 修 勾 值 。f.,。(t|u) 的 均值 、 众 数 或 中 位 数 ， 都 可 取 做 修 义 
向 量 。 在 KK -J 方法 中 ， 由 于 后 验 分 布 是 多 元 正 态 分 布 ， 这 三 者 是 完全 相同 
的 。 这 个 共同 的 向 量 ， 我 们 已 用 v 表示 修 色 向量， 由 式 (11.2.23) 给 出 。 
值得 注意 的 是 ， 由 于 式 (11.2.23) 中 需要 对 两 个 较 难 的 抢 阵 求 道 ， 因 些 将 
式 (11.2.23) 重新 整理 为 : 

v=u+ (I+AB) (m-u)=m+ (I+BA-) (u-m) (11.2.24) 
这 里 工 是 n 阶 单位 阵 。B 是 对 角 阵 ， 容 易 求 道 。 所 以 式 (11.2.4) 只 需要 
对 一 个 较 难 的 矩阵 求 逆 。 

从 式 (11.2.23) 和 (11.2.24) 可 以 看 出 ， 元 素 m、A 和 B 都 是 修 勺 
方法 的 参数 ， 为 了 实施 修 勾 ， 必 须要 确定 它们 。London 讨论 了 参数 确定 指 
导 性 原则 ， 本 书 在 此 不 叙述 0。 

2. Dirichlet 修 匀 。 前 面 所 讨论 的 修 义 ， 着 重 于 估计 不 同年 龄 的 死亡 率 。 
然而 ， 在 有 些 参 数 生存 模型 中 ， 年龄 并 不 是 重要 因素 ,可 以 不 考虑 ， 而 只 
考虑 不 同时 间 区 间 上 的 死亡 率 。 如 一 种 特殊 手术 后 病人 的 生存 概率 。 这 类 
问题 ， 可 以 用 Bayes 修 义 的 思想 进行 修 义 。 下 面 介 绍 的 Dirichlet 修 匀 就 是 处 
理 这 类 问题 的 一 种 方法 。 ， 

设 D, 为 第 i 个 时 间 区 交 的 死亡 人 数 ， 开始 观察 时 ， 群 体 人 数 为 4， 最 





@ 参见 Dick London 著 、 徐 诚 浩 译 :《 修 匀 数 学 》， 上 海 科 学 技术 出 版 社 1996 年 版 , 第 98 ~102 页 。 
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a 


后 一 个 死亡 最 迟 发 生 在 第 n 个 时 间 区 间 内 ， 则 显然 有 》 D =d。 令 D= 


(D,,…,D,)， 则 D 的 分 布 是 多 项 分 布 B(d,,… ,d,) ， 其 分 布 为 : 
d! 





- i (11.2.25) 
Ta” 

对 于 式 (11. 2.25) 有 以 下 几 点 说 明 : 

(1) d= (d,,…,d,)' 是 不 同时 间 区 间 的 死亡 人 数 构 成 的 列 向 量 ; 

(2) t= (ty,…,t,)',， ti 为 茶 个 人 在 第 i 个 时 间 区 间 上 的 死亡 率 ， 用 精 
算 符 号 表示 为 , ,| cu; 


(3) > d, = 二 2 
令 T=(T,,…,7,)'，7, 是 Bayes 观点 中 心 所 对 应 的 随机 变量 。 在 
Dirichlet 修 匀 中 ， 假 设 工 的 先 验 分 布 是 Dirichlet 分 布 ， 其 密度 函数 为 : 


FT( > ai ) n 
f(t) =—— [I ,a >0;0 二 二 和 1 =1 (11.2.26) 


IT ro) 


仿 a = 全 mW 网 易 知 区 (TD)=a]as 
经 计算 , T 的 后 验 分 布 仍 是 Dirichlet 分 布 ， 密 度 函 数 为 : 


Pyi(d|t) = 


FPCY (a +d), 








万 pt gd) = 一 一 一 一 加 全 co > 00 <i sli=1,n 
TI rc +2) 
t= 
由 Baysian 修 匀 的 结论 知 : 
BC 
We a+d 
2 1 
用 和 矩阵 表示 为 v= 一 了 (3+9)， 其 中 a= (a,… ,4,)。 


【 例 11-4】 考察 200 只 被 注射 某 种 药物 的 老鼠 未 来 每 年 的 存活 情况 ， 
已 知 这 些 老鼠 最 多 存活 10 年 ， 且 先 验 观点 是 工 = (也 ,… ,7。) 服从 Dirichlet 
分 布 ， 人 参数 a= (a,,…,aw) 满足 > ai = 600,a = 15 , | ci 是 一 个 等 差 级 
数 。 试 求 这 群 老鼠 的 生存 概率 。 

解 由 题 意 a,=a,+(i-1)k, i=1,…,10， 因 此 600 = > a, = 150 + 


45k, 从 而 推出 k=10。 因 而 ， 


Qitd: 25+10i 5 +2i 
atd 800 ~ 160 
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本 da a i a in i” dng, rd re > 
所 以 
, .、_5+2i ER 
S(i-l1)-S(i)= 160 i=1,.…,10 
于 是 有 
Se el ti mm 
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表格 数据 修 色 方法 很 多 ， 如 图 表 修 勾 、 方 差 补 整修 色 和 参照 标准 表 修 
匀 等 ， 它 们 都 比较 直观 易 懂 ， 这 里 就 不 一 一 介绍 了 ， 有 兴趣 的 读者 可 以 查 
阅 相 关 文 献 。 


$11.3 参数 修 尺 


前 面 所 介绍 的 表格 数据 修 匀 都 是 取 定 一 个 观察 序列 u,, 作为 对 真实 序 
列 zi 的 初始 估计 序列 ， 表 根据 关于 i 的 先 验 观点 ， 修 改 这 个 序列 的 值 ， 产 
生 一 个 修正 估计 序列 v.。 修 正 序列 v, 都 表达 成 数值 形式 。 在 本 节 中 ， 我 们 
所 讨论 的 参数 修 义 法 与 表格 数据 修 匀 法 的 基本 差别 在 于 ， 修 正 序列 表达 成 
自 变 量 x 的 一 个 数学 函数 ， 因 而 修 匀 值 记 号 v, 就 表示 成 x 的 带 参 函数 ， 这 
些 参 数 必须 由 观察 数据 所 确定 。 当 然 ， 所 得 孙 数 能 用 来 对 所 有 所 需 的 x 求 
值 ， 如 果 需 要 的 话 ， 修 匀 值 还 能 以 表格 形式 表示 。 


11.3.1 函数 形式 

在 参数 修 匀 法 中 ， 估 计 问 题 已 归结 为 曲线 拟 合 问题 。 本 节 将 讨论 的 三 
种 沙 数 形式 都 是 用 来 表示 死亡 数据 的 ， 是 关于 死亡 力 jv, 的 含 参 函数 形式 。 
根据 寿险 精算 理论 ， 死 亡 率 9. 与 死亡 力 w. 的 关系 式 是 : 

二 。 生 1 一 1 

因此 ， 从 本 质 上 看 ,4 和 9. 一 一 对 应 。 

由 于 在 第 二 章 中 ,对 几 种 特殊 的 死亡 力 形式 已 作 过 详细 讨论 。 因 此 ， 
这 里 只 做 些 简 单 的 描述 。 

1. Gompertz 形式 。 


人 = Be’, B>0, c>1 
两 边 对 数 变 换 : 
logu, = logB + (logc)x (11.3.1) 


一 个 具体 的 问题 是 : 所 给 的 死亡 力 数 据 是 否 适合 这 个 模型 ? 解决 这 个 
问题 的 方法 是 数据 合适 性 预 检 。 如 果 数 据 适合 Gompertz 形式 ， 则 logy, 相对 
于 zx 的 图 像 应 近似 为 一 条 直线 ; 如 果 得 不 到 这 种 近似 直线 ， 那么 应 考虑 另 
一 种 函数 形式 。 


如 果 初 始 估计 zx. 是 生存 概率 ， 此 时 Compertz 形式 是 : 


ee-l) 


PpP:.=8 
这 里 ，g ,< 均 是 确定 性 常数 。 对 数 变换 为 

logp, =c(c-1)(logg) 
于 是 ， 

logp..，_ 

logp, 
因此 ， 数 据 合 适 性 预 检 方 法 是 看 logu,,,/logu, 是 否 接 近 于 常数 。 

2. Weibull 形式 。 





KL.=k(x-a), x>a, k>0, n>0 
或 当 a =0, ,= kx"。 其 对 数 形 式 为 : 
logu, = logk + nlogx (11.3.2) 
数据 合适 性 预 检 法 是 检查 logu, 关于 logx 的 曲线 是 否 近 似 为 一 条 直线 。 
如 果 初 始 估 计 uw, 是 生存 概率 ， 有 











k n+l n+t+l 
pr op | “i [C(x+1) x ]| 
1 k ntl _ n+t+l a k n+l 
和 lnp, = i [(x+1) 2 过 1A” 
如 果 n 是 整数 ， 则 
| n n+l n+1l k 
i 二 |! = 一 jl 
A "lnp, 二 二 本 二 (n+1)! kn! 





是 常数 。 因 此 ， 当 uw, 是 生存 概率 而 非 死亡 力 ， 数 据 的 预 检 方法 就 是 构造 关 
于 lnu, 的 差分 表 ， 看 它 的 n 阶 差分 是 否 接近 于 常数 。 
3. Makeham 形式 。 
1.=A+Be 和 p,=s* 8g 
在 此 情形 下 ，logu, 既 不 是 线性 ， 也 不 是 对 数 一 线 性 的 ， 因 此 在 最 小 二 乘 拟 
合 时 ， 必 须要 做 些 修正 。 在 数据 w, 为 死亡 力 和 生存 概率 时 的 数据 预 检 法 
是 什么 呢 ? 留 给 读者 作为 练习 。 


开 3.2 参数 估计 


1. 配置 法 。 参 数 估计 的 配置 法 是 利用 恰当 的 差分 运算 来 确定 参数 值 。 
为 说 明 这 种 方法 ， 假设 w, 是 p, 的 初始 估计 值 ， 下 面 采 用 Makeham 形式 来 说 
明 。 其 等 价 形式 为 : 

oz(c-1) 


Pp, = SE (11.3.3) 
选取 三 个 等 间隔 的 自 变量 x*,，x +r,，x+2r， 有 


@ 参见 Dick London 著 、 徐 诚 浩 译 :《 修 匀 数 学 》 ， 上 海 科 学 技术 出 版 社 1996 年 版 ， 第 122 页 。 
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A, 是 间隔 为 r 的 向 前 差分 ， 即 
Af(x) =f(x +r) -A(x) 
由 此 可 确定 c。 由 A,logu, = (c 一 1)(c -1)(logg)c 确定 g。 最 后 由 
A,logu, =logs + (c +1) (logg)ce’ 
可 确定 s。 
事实 上 ， 这 个 模型 中 有 三 个 参数 ,已 知 函 数 中 的 三 个 点 相当 于 确定 了 
三 个 方程 ， 在 一 定 条 件 下 ， 可 以 解 出 所 有 的 参数 。 同 样 如 果 初 始 估计 值 多 
于 三 个 ,那么 根据 配置 法 ， 就 可 能 得 到 参数 的 不 同 估 计 ， 此 时 ， 取 含 问 题 
非常 棘手 ， 这 便 是 这 种 方法 的 不 足 之 处 。 
2. 最 小 二 乘 修 匀 法 。 考 虑 一 般 的 线性 关系 式 : 
J (11. 3.4) 
注意 式 (11.3.1) 就 是 这 种 形式 ， 其 中 心 =- logu 和 xz =w。 类 似 地 ， 
式 (11.3.2) 也 是 这 种 形式 。 对 式 (11. 3.4 ) 构造 最 小 二 乘 画 数 : 
SS = > w, (u” —a— bx )’ 


x=1 


令 2 =0， 2 =0 得 到 线性 方程 组 ， 求 解 可 得 a 和 5 的 值 。 


若 u, 是 非 线 性 的 ， 可 通过 变换 使 其 线性 化 。 如 Compertz 模型 人 . = Be”， 

取 对 数 则 有 
logu, = logB + xlogc 

车 已 知 j, 的 观测 值 序列 fu,1} ， 则 用 最 小 二 乘法 估计 参数 log8B，logc 之 
后 , 任 给 x*， 都 可 以 得 到 一 个 x, 的 修 匀 值 或 是 新 的 估计 值 。 

3. 极 大 似 然 法 。 在 精算 实务 中 ， 若 死亡 力 的 含 参 函 数 形 式 已 知 ， 则 各 
种 事件 〈 如 和 死亡、 退出 等 ) 的 概率 值 的 形式 也 已 知 ， 于 是 可 利用 极 大 似 然 
估计 法 获取 参数 的 估计 ， 但 样本 信息 不 同 ， 似 然 函 数 也 就 不 同 。 下 面 分 情 
况 讨论 这 种 方法 。 

(1) 完整 数据 、 精 确 死 亡 年 龄 。 此 时 的 样本 信息 是 : 已 知 第 i 个 人 进入 
观察 的 年 龄 为 x;,， 死 亡 年 龄 为 y， (i=1,…,n)， 于 是 对 于 每 个 人 【事件 ) 
所 对 应 的 似 然 因 子 为 : 


极 小 化 SS， 


L: =,-sPs Ly, = exp(— 三 wa)m (11. 3.5) 
总 体 似 然 函数 为 : 
L = IT L, 


I SD | as) (11. 3. 6) 


车 已 知 j, 的 参数 形式 ， 通 过 极 大 化 InL， 可 得 参数 估计 。 

(2) 非 完 整数 据 、 精 确 死亡 年 龄 或 退出 年 龄 。 此 时 的 样本 信息 为 : 在 
观察 期 内 ， 每 个 人 要 么 死亡 ， 要 么 退出 。 其 中 , 第 i 个 人 ， 若 死亡 ,死亡 
年 龄 记 为 y,;; 若 退 出 ， 所 观察 到 的 退出 年 龄 记 为 a.(i=1,…,n)。 死 亡者 的 
全 体 记 为 D， 退 出 者 的 全 体 记 为 W。 此 时 ， 每 个 在 z, 退 出 的 人 对 应 的 似 然 
因子 为 : 


L; =,p: = exp( 一 [4.4s) (11.3.7) 


这 里 ，x; 为 进入 观察 的 年 龄 ， 下 同 。 
每 个 死亡 人 的 似 然 因子 为 式 (11.3.5)， 统 一 式 (11.3.5) 与 式 
(11.3.7) 的 形式 ， 无论 如 何 ， 第 i 个 人 的 似 然 因 子 可 表示 为 : 


,= exp(— { pds) Cp.)® (11. 3. 8) 


其 中 ， 

_ 0， 第 i 个 人 活着 (退出 ) [#4， 第 i 个 人 活着 (退出 ) 
全 第 i 个 人 死亡 | 第 i 个 人 死亡 
总 体 似 然 函数 可 表示 为 : 


= Lexp( fia) I exp - [ds) [exp( -人 Lds) Cpe)” 
则 
InL = 了 (alnw。- | wds) (11. 3.9) 


车 ,的 参数 形式 已 知 ， 则 通过 极 大 化 InL， 可 得 参数 估计 。 

【 例 11 -5】 茶 一 死亡 力 研究 从 1984 年 1 月 1 日 开始 ， 到 1988 年 1 月 
1 日 结束 ， 观 察 结 果 如 表 11 -2 所 示 。 

死亡 力 ,= kx， 求 上 的 极 大 似 
然 估计 。 表 11 -2 

解 : 了 =:P HA 4 pi * Ds 1984 年 1 月 1 日 的 年 龄 观察 结果 
=e (3k)e ee lt — 3k. ee 甲 1 1986. 1. 1 死亡 

lInL = 1n3 + lnk — 38k 乙 2 1988. 1. 1 仍 生存 

olnL ^ 1 丙 3 1986. 1. 1 退出 

(3) 不 完整 数据 、 分 组 死亡 、 
精确 退出 年 龄 。 在 精算 实务 中 ， 经 常 遇 到 研究 个 人 人 身 险 投保 人 死亡 率 的 
情况 。 假 设 考虑 期 为 Z~Z+m 年 (这 里 的 “年 ” 指 保 险 年 度 ) ， 采 用 保险 
年 龄 以 使 所 有 被 考察 的 投保 人 的 年 龄 都 为 整数 年 龄 ， 且 进一步 假设 所 有 的 
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退出 都 发 生 在 保险 年 度 内 ， 因 而 也 是 整数 年 龄 。 死 亡 年 龄 取 为 死亡 那 年 对 
应 的 保险 年 龄 。 

设 ". 为 进入 考察 时 年 龄 为 x 岁 的 人 数 ，vw. 为 在 x 岁 退出 的 人 数 ，68. 为 
在 年 龄 区 间 (x,， x +1] 内 死亡 的 人 数 。 观 察 记 录 的 最 低 年 龄 为 a 岁 ， 最 高 
年 龄 为 an 岁 。 

显然 ， 进入 年 龄 区 间 (7 ,+1] 的 人 数 为 : 


- 六 (rn —w,—0..) = 六 Cn 一 Ww, 一 6.) +0 


则 4 -0 = - w, — 0,) 


在 这 个 年 龄 区 间 上 ， 有 6 个 死亡 ， 4 -9 个 生存 ， 这 个 年 龄 的 似 然 因 
子 为 : 
五 =(9) (1 -gq)”” 


总 似 然 函数 为 : 
r=- Js = 0 -oo 
则 InL = Doing, - > (A, — o) 


车 多, 的 参数 形式 已 知 ， 则 由 lnL 极 大 化 此 可 获得 参数 估计 。 


11. 3.3 分 段 参数 修 义 

前 面 讨论 的 参数 形式 都 是 单一 的 函数 形式 ， 但 这 样 做 很 难得 到 满意 的 
修 匀 结果 。 更 一 般 的 做 法 是 ， 在 x 的 不 同 区 域 上 ， 用 人 不同 形式 的 省 参 函 数 
拟 合 它 。 这 种 方法 叫 分 段 函数 修 匀 ， 又 叫 样 条 修 匀 。 

样 条 修 匀 的 基本 特征 是 ; 那些 不 同 区 域 上 的 氢 合 函数 有 比较 简单 的 形 
式 ， 如 二 次 或 三 次 多 项 式 。 在 结 点 处 ， 满 足 光 滑 性 要 求 ， 如 连续 、 一 次 可 
微 等 。 

1. 最 小 二 乘 三 次 样 条 。 假 设 有 初始 估计 值 w,，xe [a,， 585]。 关 于 tt 的 
先 验 观 点 是 修 匀 值 v, 是 (或 近似 可 表示 成 ) 一 个 三 次 多 项 式 。 令 | 

v, = cl + CX tox + ex 


利用 最 小 二 乘法 估计 参数 c, ，c, ，c: ，cs。 可 构造 函数 


6 





SS = > wu -ci — cx%— cx 一 co) (11. 3. 10) 
全 238 -0(i -1.2,3,4) 。 可 得 矩阵 方程 
X’WXc =X’Wu (11.3.11) 
其 中 ， 


1 a+l (ac+l) (a+1)’ 


Wo, -1i 


Wad Gal) 3-a-l) 
c=(c,, ¢,, Cc3, ©¢4) 
求 得 < ,完成 修 勾 。 
2. 两 缴 三 次 样 条 。 关 于 i 先 验 观点 是 : v. 是 [a, b] 上 的 分 段 三 次 多 
项 式 ， 在 大 处 相连 接 ， 即 


po(%), a<x<k 
v. = (11.3. 12) 
pi(zx), k<x<b 


这 里 , 大 称 为 结 点 。 
根据 最 小 二 乘法 构造 函数 : 


k 


SS = 之 w, [u, ~ po(x)] 2 w[u, 一 PCxz)]】 (11.3.13) 
这 里 为 不 大 于 的 最 大 样本 下 标 值 x。 
为 了 得 到 光滑 连接 ， 要 求 在 两 个 淆 数 的 连接 处 kk， 有 相同 的 函数 值 和 一 
po(k) =p,(k) 
阶 、 二 阶 导 数 ， oo = p(k) (11.3.14) 
p(k) =p'(k) 
式 (11.3.14) 是 确保 在 整个 区 间 [a, 6] 上 的 i 二 阶 连 续 可 微 。 由 
此 可 令 
Po(X) =c, +CeX+eX + ecx’ 


pi(%) =cl+cxX+c 和 +c +ces (x—k)’ (11.3.15) 
代入 式 (11.3.13) 并 令 2 =0,(i=1,2,…,5)， 可 得 关于 。 的 线性 方程 


组 ， 并 完成 修 匀 。 
一 般 的 情形 是 存在 个 结 点 hh,…,k,，v, 由 于 个 多 项 式 组 成 ， 即 


Po(X), a<x<h, 
v=4P(x), ke<x<h, 
P,(x) ， k, SxSEb 
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全 部 的 光滑 性 (二 阶 连 续 可 微 ) 条 件 可 表示 成 : 
Pi (ki) =p;(k.) 

Pii(ki) =p,(k,), i=1,.,n 

pii(k) =p,(k,) 





由 此 可 设 
pi(x) =po(x) tes (x—k) + tox—k) ,i=1,2,.…,n 

在 实际 应 用 中 ， 结 点 的 选择 非常 重要 。 和 仔细 观察 u, 的 图 像 ， 在 形状 有 和 较 
大 起 伏 的 地 方 ， 应 设置 结 点 。 结 点 个 数 越 多 ， 拟 合 程 度 越 高 ， 计 算 量 也 越 大 。 

【 例 11-6】 已 知 : 

Po(Cx) ， 10<x<E 
| -0.0064(xz -天 ) ， 5<x<13 11<k<12 
(2) 相关 数据 如 表 11 -3 所 示 。 

















表 11-3 例 11 -6 中 的 数据 
% Ws LL, Po(x) 
10 4 0.02 0. 020 
11 4 0.03 0. 031 
12 2 0.04 0. 042 
a 
13 本 3 0.04 0.053 











用 最 小 二 乘法 样 条 修 匀 法 来 拟 合 观察 值 x.， 并 求 K。 
解 : SS = 》 (一 已) wo。 
=(0.02 -0.02)’ x4+(0.031 -0.03)* x4 +[0.042 -0.0064(12 -天 ) -0.04] 
x2 +[0.053 -0.0064(13 -~k) -0.04] x3 


令 3 =0, 得 k=11.3。 入 


11.3.4 光滑 连接 修 久 


RE NER ED 


样 条 修 匀 是 用 最 小 二 乘法 确定 每 一 段 ( 子 区 间 ) 上 的 多 项 式 函 数 。 本 
小 节 仍 然 试 图 确定 每 一 段 〈 等 距 区 间 ) 上 的 多 项 式 函 数 , 但 是 。 所 用 的 方 
法 却 不 是 最 小 二 乘法 而 是 采用 Everett 公式 ， 这 种 修 匀 方 法 叫做 光滑 连接 
修 勾 。 

1. 表达 式 。 光 滑 连 接 修 匀 方 法 的 基本 表达 式 如 下 : 

vs = Fls)u,, t F(t)u,, O<s<1, t=1-s (11.3.16) 

这 个 表达 式 又 叫做 Everett 公式 。 

这 里 ，F(s) =4(s) +B(s)8 + C(s)6 +-…, 而 4A(s),B(s),C(s),-…, 是 


关于 s 的 函数 。5 是 中 心 差分 算 子 ， 其 定义 如 下 : 


aa) =/ (4+ 广 ) -f(:- 壹 ) 


f(x) =6[ f(x)] =f(z +1) -2f(x) +f(x-1) 


ax) =/ {z+})- C! A tA sh CL [| 
(11.3. 17) 
当 F(s) 的 表达 式 中 的 最 后 一 项 为 6" 时 ， 则 在 区 间 [x, x+1]」 内 ,vyv,,，, 
(0 三 s 近 1) 的 值 除 依赖 于 s 的 值 外 ， 还 依赖 于 2m +2 个. 的 值 : 
因此 ，Everett 公式 又 叫 人 点 插值 公式 。 
当 F(s) =s 时 , 式 (11.3.16) 变 为 : 
Vs = SU Lr ttu, 
这 便 是 大 家 熟悉 的 线性 插值 公式 。 
2. 光滑 性 。 最 基本 的 要 求 是 : 在 结 点 处 的 修 匀 值 相等 ， 即 
CP eS A ea (11.3.18) 
由 了 Everett 公式 
2 | =ACT)u, + B(1)Ou, + C(1)6u, +… 
+A(O)u, ,+B(0)6u,, +C(0)6u,.,+ 
zs | ,so =ACO) ut + BC(O)Ou,,, + C(O0)6 ,+ 
+A(l)u, +B(1)6u, +C(1)6u, + 
比较 式 (11.3.18) 的 两 端 ， 欲 使 之 成 为 等 式 ， 当 且 仅 当 


4(0) =B(0) =C(0) =… =0 (11. 3. 19) 
车 光滑 性 要 求 是 在 结 点 处 的 一 阶 导 数 相 等 ， 则 
和 人 人 (11. 3. 20) 


满足 式 (11.3.18) 和 (11.3.20) 的 插值 公式 称 为 相 切 的 。 
由 于 FF'(s) =A4’(s) +B'(s)6 +tC'(s)6 + 


aF (l(t) _ 
ds | 


则 比较 式 (11. 3.20) 两 端 ， 有 
F'(1)u,-F’'(O0)u, ,=F’(0)u,,, -FF'(1)u, (11.3.21) 
或 2F'(1)u,=F'(0) (un tu,) = (0)(2+5)u。 
因此 ， 2F'’(1) =F'(0)(2+6) (11. 3.22) 
车 光滑 性 要 求 是 在 结 点 处 二 阶 左 、 右 导数 相等 ， 则 


nn 


A A ey (11. 3.23) 


—F'(t) 


了 


可 推 知 : 


的 总 
F"(0) (wu,,,—u..1) =0 (11. 3.24) 

则 
F"(0) =0 (11.3.25) 
4"(0) =B"(0) =C"(0) =0 (11. 3.26) 


即 式 (11.3.22) 和 “(11.3.26) 是 插值 公式 密切 的 充分 必要 条 件 。 
3. 再 生性 。 若 Everett 公式 具有 再 生性 ， 则 


v, =2. =9,,, | ,0 =A(l)u, +B()Ou, +C(I)5 +-… (11. 3.27) 
等 价 于 
A(1) =1,B(1) =C(1)=:…=0 (11. 3. 28 ) 


4. 精确 度 。Everett 公式 的 精确 度 指 的 是 再 生 多 项 式 函 数 的 最 高 次 数 。 
为 了 给 出 精确 度 的 判别 准则 ， 先 研究 中 心 差分 算 子 5 与 向 前 差 算 子 A 
的 关系 。 由 简单 的 代数 运算 ， 得 恒等式 


A (11. 3.29) 
A 算 子 本 身 有 如 下 性 质 : 
A (11.3.30) 
从 而 推出 Everett 公式 的 向 前 差分 表示 : 
v,,, =[4(s) +A(t) |u, +A(s)Au, + [B(s) +B(i) ]A?w. ， 
+B(s)A w+ [G(s) +C()] A'w,, +C(s)A ,+ 
(11. 3.31) 


由 此 可 推出 ，Everett 公式 的 精度 为 z 的 充 要 条 件 是 : 表 11 -4 所 得 到 
的 前 (z+1) 个 等 式 成 立 。 

5. 四 点 修 匀 公式 。 通 常 所 说 的 
四 点 修 匀 公式， 其 f(s) 的 最 后 一 项 


表 11 -4 


条 件 














0 A(s) +A(1 -s) =1 

为 8 (m=1)。 我 们 试图 寻求 满足 一 ee 
如 下 条 件 的 四 点 公式 : 

(1) 精确 度 为 1; 2 B(s) +B(1~s) = 二 s(s-1) 

(2) 光滑 性 条 件 为 结 点 处 一 阶 
导数 相等 ， 即 是 相 切 的 。 3 B(s) = -1) 

此 时 ， 

Ds, = Fs)u, +F(t)u 4 CD) +C(L-9) = 页 s(92 -1)(s-2) 





(11.3.32) 


其 中 ，F(s) =4(s) +B(s)6。 由 (1) 知 4(s) =s, 由 (2) 知 8(0)=0 且 
2F'(1) =F'(0)(2+6*)， 即 


B(O0) =0,B'(0) =0,B'(1) = 六 (11. 3.33) 


若 B(1) =L， 和 县 选择 B 为 满足 这 些 条 件 的 最 低 次 数 多 项 式 ， 则 
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)* + -20)s (11.3. 34) 


Bl(s) = 一 1) 


该 公式 称 为 Karup -- King 公式 。 

当 工 = 地 时 ， B(s) = 

当 工 = 去 时 ， B(s) = 
此 公式 是 四 点 公式 中 的 唯一 密切 公式 ， 即 在 结 点 外 v,,, 的 二 阶 左 、 右 导数 
相等 。 

【 例 11 -7】 用 Everett 四 点 修 匀 公式 修 匀 zx 得 到 w， 已 知 

(1) 此 公式 是 线性 的 ; 

(2) 此 公式 是 密切 的 ; 

(3) B(s) 是 次 数 不 超 过 3 的 多 项 式 ; 


(4) Vr 二 2 iver 
求 系数 a,。 
解 : 由 (1) 知 4(s)=s, 由 (2)、(3) 知 B (s) = 


二 = 下 (王权 +F (3).=[4 (全 +B (| + w,) 


了 + | Cu + wu,) = + wu,) + —2u 本 
tu, tu — 2u, + ui1) 
把 上 式 与 (4) 相 比 较 易 知 ，as = 祝 。 四 


1. 什么 是 修 匀 ? 当 修 匀 死 亡 率 时 ， 对 修 匀 结果 有 些 什 么 基本 要 来 ? 
2. 一 组 初始 估计 及 对 应 的 修 匀 值 如 表 11 ~5 所 示 。 


0.071 0.076 0.040 0. 104 0. 160 0. 058 
0.058 0.062 0.067 0.072 0. 077 0. 083 
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(1) 试 计 算 光 滑 莫 子 书 


I 
MM 
D> 
从 
上 


(2) 试 计算 拟 合 算 子 FE = 》 wv, 一 2) ,Fs = 》 xw,(u,—v.) 


这 里 w,=n, 的 取 值 如 表 11 -6 所 示 。 





表 11 -6 
x 70 71 72 73 74 76 ?7 78 
| 
Ww 135 143 140 144 149 150 139 145 


(3) 车 线性 修正 修 匀 值 ， 即 令 v.=av,+b， 使 =F=0，,， 试 确定 a, 4b 


的 值 ， 并 解释 这 种 做 法 的 直观 含义 。 


3. 设 有 数据 wu,,，x=20,，21,--*,59， 若 采用 几 =6 的 M-W-A 方 法 修 


匀 此 数据 组 ， 则 


(1) 计算 wo 时 ， 与 a-, 相 乘 的 凡 的 下 标 值 x 为 多 
(2) 计算 ws 时 ， 与 wa 相 乘 的 系数 a 的 下 标 值 是 


(3) 有 多 少 项 用 来 计算 某 个 特定 的 v,? 


少 ? 
多 少 ? 


7 


(4) 计算 vw, vi 和 wv,,y 时 ， 将 出 现 多 少 个 不 同 的 ,3 

(5) 根据 这 些 wu,， 能 产生 一 些 修 匀 值 v,， 确 定 这 些 v, 的 下 标 x 的 范围 。 

4. U\，U,，U, 是 三 个 二 项 比例 随机 变量 ,假设 它们 相互 独立 ， 且 有 相 
同 的 方差 oo 。 设 i 是 一 个 线性 浮 数 ， 分别 从 容量 n,n,， ns 的 样本 中 ， 得 - 
到 初始 估计 值 wl，w,，w。 甲 想 采 用 重复 实验 且 把 容量 扩大 成 3n, 的 方法 产 


3 
生 4 的 较 好 的 估计 ; 乙 想 把 灵 ，w，U, 加 权 平 均 ， 即 一 作为 


t, 的 修正 估计 。 试 问 谁 的 关于 i 的 修正 估计 有 和 较 小 的 方差 。 


5. 车 初始 估计 的 暴露 数 如 表 11 -7 所 示 。 
M-W-A 的 具体 表达 式 如 下 : 
Va 二 > QU 
它 再 生 一 次 多 项 式 ， 且 在 下 列 假 设 下 最 小 化 
Var(vs) 以 确定 修 匀 值 v: 
(1) 随机 误差 {E,,,| 相互 独立 ; 





(2) Var(E,,,) = Var(E.,) 一 ， 试 求 an 
及 v4 的 值 。 
6. 两 种 不 同 的 M-W-A 表达 式 如 下 : 
1 1 
< = FU + 了 7 


这 =DU +ar +bU,, 





表 11-7 
43 44 45 
125 150 150 


且 已 知 : 

(1) Vi 再 生 线 性 函数 ; 

(2) 6Var(V.) = Yar( 太 ); 

(3) 随机 误差 五 .相互 独立 ， 且 方差 相等 ; 

(4) a>0。 
试 求 5 的 值 。 

7. 考虑 z=1 的 Whittaker 修 匀 : 

(1) 假设 对 所 有 的 x，w, =w 为 一 常数 ， 且 hh=w， 试 比较 w=10 时 
的 值 与 妈 =1 时 zw 的 值 可 得 出 什么 结论 ? 

(2) 假设 对 所 有 的 x，w, =w 为 一 常数 ， 且 hh 了 ww， 设 v, 是 在 这 种 情形 
bk 
w 


下 的 修 匀 结果 。 设 对 所 有 的 x 都 有 w,=1 且 h” = 一 。 此 时 的 修 匀 结果 为 v，。 


试 比 较 v 和 vw。 . 

8. 在 Whittaker 修 匀 中 ， 假设 由 9M/9v, =0 所 得 的 后 一 个 线性 方程 是 
-zy +3v, 2 一 32, 1 +kv, =w,， 相 应 的 权 是 w, =2， 求 上 的 值 。 

9. 某 个 Whittaker 修 匀 ， 可 由 正面 方 程 组 确定 : Cv =wu。u=[1, 1, 2]'; 
有 =3; z=1; w,=1, x=1, 2,，3。 试 求 v,。 

10. 设 TI，T,,，7T, 是 相互 独立 的 正 态 随机 变量 ,其 先 验 的 均值 和 协 方 
差分 别 是 


n-2 


1/4 0 0 
m=[2, 6, 6], A=|0 1 0 
0 0 2 





观察 值 (初始 估计 值 ) 为 u=[1,，14,，18]'， 条件 协 方差 矩阵 Var(U|T) 为 : 
1/5 0 0 
B=| 0 3/4 ,| 
0 0 2/3 


试用 息 -J 法 求 修 匀 向 量 v。 

11. 对 某 3 个 观察 值 ， 用 息 -J 法 修 匀 ， 且 已 知 : 

(1) Var(7T,) =i 也 与 也 的 相关 系数 为 sz= 人 3 ， Ey 

(2) 矩阵 了 是 对 角 阵 ， 且 对 角 元 素 就 是 A 的 对 角 元 素 ; 

(3) v—-u=[0.01, 0.02, 0.04]’。 
求 m 一 lo 

12. 用 Dirichlet 方法 进行 修 匀 ， 第 工 个 时 间 区 间 的 死亡 率 是 先 验 死亡 率 
ms; 与 估计 死亡 率 的 加 权 平 均 ， 先 验 死 亡 率 之 权 数 为 5 人 9。 且 mmi;=0.06，d= 
200 ， 先 验 分 布 之 套数 分 别 为 a,,… ,Qa,， 试 求 ai。 

13. vw 是 选择 年 龄 为 x 的 首 年 选择 死亡 率 的 修正 值 ，v, 是 终极 年 龄 为 x 
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的 终极 死亡 率 的 修正 值 。 假 设 这 两 列 修 匀 值 都 是 满意 的 。6i.,, 表 示 选 择 年 
冷 为 <， 到达 年 龄 为 x+r 的 观察 死亡 人 数 ，n,,, 表 示 相 应 的 暴露 人 数 ， 假 
设 它们 是 有 效 的 。 对 于 r=1，2,…, 大 -1， 则 关系 式 
Via = QV 十 (1 —a,)v,,,,0 <a,<l 

确定 每 个 修正 选择 死亡 窑 v1,,,， 这 里 a, 仅 依赖 于 保障 期 限 r， 而 与 x 无关。 
这 就 是 说 ， 每 个 修 匀 选择 死亡 率 是 以 下 两 个 量 的 线性 插值 ， 它 们 是 具有 相 
同 到 达 年 龄 的 首 年 死亡 率 和 终极 死亡 率 ， 位 于 “向 上 对 角 线 ”的 两 端 。 对 
每 个 r，a, 由 以 下 等 式 确定 


> Qi 三 2 D+ Dsl+r 

即 保障 期 限 同 为 r， 所 有 选择 年 龄 的 观察 死亡 人 数 的 总 和 等 于 死亡 人 数 的 
总 和 。 

(1) 选择 期 的 长 度 是 多 少 ? 

(2) 当 r 增 加 时 ， 在 正 选择 模型 中 ， 你 认为 a, 将 是 上 升 还 是 下 降 ? 在 
负 选 择 模型 中 呢 ? 

(3) 导出 确定 a, 的 公式 。 

14. 对 于 表 11 -8 的 数据 ，(1) 采用 Gompertz 形式 修 匀 ， 确 定 c 和 8g。 
(2) 将 上 题 的 gq, 转换 为 人.， 应 用 最 小 二 乘法 重新 确定 co。 


天 11-8 


gx 0. 02875 0. 03099 0. 03339 0. 03598 0. 03876 


15. 对 于 表 11 -9 的 数据 ， 采 用 Weibull 形式 修 匀 ， 其 中 =0， 确 定 卫 
和 上 的 值 。 











表 11 -9 
x 30 31 32 33 34 
Ks 0. 00065 0. 00076 0. 00089 0. 00104 0. 00121 


16. 假设 死亡 力 被 认为 是 年 龄 的 线性 函数 ,1, = bx。 考 虑 由 nn 个 观察 年 
冷 同 为 x 岁 的 人 组 成 的 祥 本 ， 且 考察 到 每 个 人 均 死 亡 为 止 。 设 第 i 个 人 的 死 
亡 年 冷 为 y,， 试 求 b 的 极 大 似 然 估计 。 

17. 对 于 20 个 确切 年 龄 为 2 岁 的 人 ,假设 死亡 力 具 有 如 下 形式 : 


i 
b+x’ 


1 个 死亡 ，19 个 退出 分 别 发 生 在 确切 年 龄 3 岁 ， 求 b 的 极 大 似 然 估计 。 
18. 假设 需要 在 区 间 [20，89] 上 拟 合 一 个 两 次 样 条 ， 设 有 3 个 接点 : 


Le, b<0, x>2 


x 二 29.7，62.5，80.6， 在 二 阶 连 续 可 微 光滑 性 条 件 下 ， 写 出 修 匀 过 程 。 
19. 若 Everett 公式 为 
vs =A(s) ur +B(s)Ou,, + Cs)6 u,, + 
+A(l ~s)u, +B(l -ss)Ou, t+C(LI-s)5 2 
试 把 中 心 差分 算 子 换 成 向 前 差分 算 子 。 
20. 若 凡 =4, wu,=7，, w=15, 试 求 F(0)u,。 


21. 考虑 两 点 公式 ,其 中 A(s) =4s -3s : 


(1) 这 个 公式 是 相 切 的 还 是 密切 的 ; 
(2) 这 个 公式 是 光滑 的 还 是 再 生 的 。 
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第 十 二 章 信和 度 理 论 





.学 习 上 有 目标 ， 

熟悉 各 种 信 度 模型 中 信 度 估计 的 计算 方法 

掌握 有 限 波 动 信 度 中 的 完全 信 度 条 件 、 部 分 信 度 和 信 度 保费 

掌握 使 用 贝 叶 斯 方法 计算 风险 的 后 验 分 布 和 贝 叶 斯 信 度 估计 值 

掌握 应 用 Biihlmann 模型 、Biihlmann - Straub 模型 及 其 推广 ， 并 理解 

它们 与 贝 叶 斯 模型 的 关系 

口 熟悉 使 用 经 验 贝 叶 斯 方法 估计 非 参 数 、 半 参数 和 参数 模式 下 的 结构 
参数 并 计算 信 度 估计 值 


$12.1 引言 





证 我 们 简单 回顾 一 下 保费 厘定 的 过 程 。 保 险 人 会 首先 根据 险种 的 特点 
和 所 有 被 保险 人 的 损失 数据 计算 得 出 一 个 基础 费 率 ,然后 根据 被 保险 人 风 
险 特征 的 不 同 ， 选 择 费 率 因 子 对 所 有 的 被 保险 人 进行 分 级 ,制定 出 各 级 别 
(风险 子 集 ) 的 相对 费 率 ， 用 来 衡量 此 风险 子 集 的 平均 风险 水 平 。 然 而 对 
于 个 体 风 险 的 厘定 ， 由 于 上 述 费 率 系统 无 法 完美 展现 和 区 分 每 个 保单 的 所 
有 风险 ， 比 如 两 份 各 费 率 因子 水 平 完全 一 致 的 保单 也 很 有 可 能 面临 不 同 的 
风险 ， 这 些 差异 来 自 于 那些 费 率 系统 没有 考虑 或 者 难以 考虑 的 因素 。 也 就 
是 说 ， 仅 仅 依 靠 手册 费 率 没 有 办 法 完美 刻画 被 保险 人 的 风险 。 

因此 ， 在 费 率 厘 定 中 ， 精 算 师 往往 需要 参考 被 保险 人 在 过 去 一 段 时 间 
内 的 损失 数据 来 预测 其 未 来 的 风险 成 本 。 这 里 又 存在 一 个 问题 ， 由 于 经 验 
损失 数据 来 自 经 验 期 内 发 生 的 保险 事故 ， 因 此 这 些 数据 本 身 就 包含 了 很 大 
的 随机 波动 ， 仅 仅 采 纳 这 些 历史 数据 来 合计 将 来 的 风险 也 是 不 准确 的 。 现 
在 需要 解决 的 问题 是 ， 经 验 数据 所 反映 的 被 保险 人 的 风险 水 平 与 风险 子 集 
平均 水 平 的 差别 中 ， 有 和 多少 是 由 于 随机 波动 所 引起 的 ? 有 多 少 是 由 于 被 保 
险 人 真 的 优 于 或 劣 于 风险 子 集 平均 水 平 而 引起 的 ? 如 何 分 配 两 者 的 比重 ? 
换 旬 话说 ， 被 保险 人 的 自身 索赔 经 验 的 可 信 度 是 多 少 ? 

信和 度 理论 为 此 提供 了 一 个 很 好 的 工具 。 信 和 度 理论 是 研究 如 何 合 理 利用 
先 验 信息 和 个 体 索赔 经 验 来 进行 估计 、 预 测 及 制定 后 验 保费 。 后 验 保费 估 
计 值 可 以 下 面 公式 来 表示 : 

后 验 保费 估计 值 =zx 经 验 值 +(1-z) x 先 验 值 





甚 中 z (0<z<1) 称 为 信 度 因子 ， 后 验 保费 估计 值 称 为 信和 度 估 计 。 只 有 正 
确 地 选择 信 度 因子 *>， 才 能 保证 调整 后 的 保险 费 接近 于 真实 的 风险 水 平 。 除 
了 保费 外 ， 信 度 理论 还 可 以 用 来 估计 索赔 数 、 总 索赔 额 、 损 失 率 、 级 别 相 
对 数 等 值 。 S 

在 本 章 中 我 们 将 详细 介绍 信和 度 理 论 中 几 种 常见 模型 。 首 先 讨 论 有 限 波 
动 信 和 度 模 型 。 有 限 波动 信 度 模型 是 20 世纪 早期 发 展 的 方法 ， 也 称 为 古典 信 
度 模型 ， 此 方法 的 一 个 目的 是 限制 经 验 数据 中 的 随机 波动 对 估计 准确 性 的 
影响 。 我 们 将 在 12.2 节 中 给 出 完全 可 信条 件 ， 并 讨论 完全 信和 度 条 件 不 满足 
时 的 处 理 方法 ， 也 就 是 部 分 信和 度 。 其 次 讨论 贝 叶 斯 信和 度 模型 。 在 12. 3 节 中 
将 介绍 信和 度 理 论 中 贝 叶 斯 方法 的 应 用 ， 并 推导 出 基于 经 验 数据 对 将 来 的 预 
测 ， 也 就 是 贝 叶 斯 信和 度 估计 。 然 后 讨论 一 致 最 精确 信和 度 模 型 。 有 限 波动 模 
型 强调 估计 结果 的 稳定 性 ， 而 一 臻 最 精确 信和 度 模型 则 着 重 强调 估计 结果 的 
精确 性 。 后 者 实际 上 是 对 贝 叶 斯 信和 度 估计 值 的 一 种 最 佳 线性 逼近 值 。 在 
12.4 节 中 将 介绍 Bihlmann 信 度 模型 和 Bihlmann - Straub 信和 度 模 型 及 甚 推 
广 。 最 后 讨论 经 验 员 叶 斯 信和 度 估 计 。 上 述 理论 在 实际 应 用 时 需要 根据 数据 
对 未 知 分 布 的 参数 进行 估计 。 根 据 分 布 形 式 是 否 已 知 ， 估 计 方 法 将 分 为 非 
参数 方法 、 半 参数 方法 和 参数 方法 ， 本 书 将 分 别 在 12.5.1，12.5.2 和 
12. 5.3 中 介绍 。 


$12.2 有 限 波动 信 度 


假设 是 我 们 要 预测 的 随机 变量 ,在 这 里 , 可 以 是 损失 次 数 、 损 失 
强度 、 总 索赔 额 ， 也 可 以 是 保费 、 级 别 费 率 、 损 失 率 等 。 经 验 观 察 值 为 X， 
j=1,…,n， 假设 [多 ,j=1,2,… ,ni 互相 独立 。 对 于 经 验 观 察 值 的 背景 有 两 
种 理解 : 一 种 情况 是 过 去 期 内 的 值 ， 比 如 过 去 n 个 月 的 月 损失 额 ， 或 者 
过 去 n 年 每 年 的 损失 次 数 ， 而 X, 为 过 去 第 j 期 的 观察 值 ; 另 一 种 情况 的 经 
验 数据 是 某 nn 个 同 质保 单 的 观察 值 ， 比 如 个 同 质保 单 上 一 期 的 理赔 额 ， 
其 中 已 为 第 7 个 保单 的 观察 值 。 

假设 E() = 上 ，1 <j<n。 即 认为 被 保险 人 在 每 个 时 期 的 损失 期 望 或 者 
同 质保 单 组 合 中 每 个 保单 的 损失 期 望都 是 相同 的 ， 保险 人 的 目标 是 确定 
的 值 ， 用 以 预测 下 一 期 的 数据 。 同 样 也 假设 Var(X,) =o ,对 所 有 j 都 是 一 
致 的 。 根 据 保险 人 先 验 知识 ,我 们 可 以 获得 半 均 值 的 先 验 估计 M， 如 根据 
过 去 的 理赔 数据 拟 合 分 布 得 到 ， 或 者 根据 其 他 具有 类 似 风险 水 平 的 被 保险 
人 的 经 验 确 定 。 如 果 我 们 要 估计 的 钱 是 纯 保 费 ，M 常 称 为 手册 纯 保费 。 经 


验 数 据 X，j=1,…,n 的 平均 值 可 以 用 久 =n"'(X,+-… +X,) 来 描述 。 容 易 
知道 ，E( 钱 ) =t，Var( 针 ) =o'/n。 有 三 种 可 能 的 方法 预测 &。 第 一 种 是 忽 
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略 过 去 的 经 验 数据 ， 直 接 令 上 二 =M; 第 二 种 方法 是 忽略 履 ， 直 接 使 用 经 验 数 


据 ， 即 令 上 = 乏 ; 第 三 种 方法 就 是 取 M 和 的 加 权 值 ， 即 z + (1 -z)M， 
我 们 称 z 为 信和 度 因 子 。 可 以 看 出 第 一 种 表述 和 第 二 种 表述 分 别 是 第 三 种 表 
述 下 z 为 0 和 z 为 1 的 特殊 形式 。 

一 般 说 来 ， 过 去 观测 数据 越 多 ， 提 供 的 信息 越 充分 ， 经 验 数据 可 信 度 


就 越 高 。 此 时 ,根据 大 数 法 则 ， 可 以 直接 用 X 估计 上 *，z 的 值 就 越 接近 于 1， 
保险 人 据 此 足以 对 将 来 获得 正确 的 估计 。 特 别 地 ， 当 z= 1， 称 经 验 数据 具 
有 完全 信和 度 。 相 反 ， 过 去 数据 越 少 ， 提 供 的 信息 越 不 充分 ， 经验 数据 的 可 
信和 度 就 越 低 。 这 时 z 的 值 接近 0, 保险 人 则 只 能 基于 先 验 信息 估计 。 特 别 
地 ， 当 z=0 时 ， 称 为 经 验 数据 没有 信和 度 。 当 0 <z<1 时 ， 称 为 经 验 数据 具 
有 部 分 信 度 


12.2.1 完全 信 度 
当 马 与 上 足够 接近 的 时 候 ， 我 们 可 以 采用 碟 来 预测 上 ， 即 取 z=1， 达 
到 完全 信和 度 和 条件。 那么 怎样 衡量 X 与 去 的 接近 程度 呢 ? 我 们 用 &- 攻 < < 
E+ 碟 ， 即 | 对 ~E| 志 花 来 表述 。 注 意 ， 这 里 由 于 铸 ,j =1,…,n 都 是 随机 变 
量 ， 所 以 也 是 随机 变量 。 因 此 我 们 设 定 在 一 定 概率 p 下 | X -上 | 三 起 总 


是 成 立时 ， 称 与 足够 接近 ， 这 时 对 数据 赋予 完全 可 信 性 (+ 接近 0,p 
接近 1) 。 用 公式 表述 为 : 


P(rtsX -été<r)=p, r>0,0 <p<l (12.2.1) 
上 式 可 写 为 : 


和 
Mo “Am Vo /n 国有 二 人 


r>0,0<p<l 





定义 y, = inf{ P( | 于 < | < y) 宇 p} (12,2.23) 


ee 


如 果 瑟 有 连续 分 布 函 数 ， 则 (12.2.2) 式 中 的 “ 宇 ” 号 可 以 换 成 “= 
号 ， 这 时 yy, 满足 


一]p =p (12.2.3) 


Sy (12. 2.4) 


第 十 二 章 ”信和 度 理论 


我 们 说 观察 值 满足 完全 可 信条 件 。 记 m = 和 /rr， 则 式 (12.2.4) 可 表 
述 为 : 


(C1) n=) (12. 2.5) 


上 述 公式 说 明 当 经 验 观 察 值 的 个 数 n 不 小 于 no,(o/E) 时 ,满足 完全 可 信 
条 件 。 
完全 可 信条 件 也 可 以 用 总 期 望 值 来 描述 ， 将 式 (12. 2.5) 改写 为 : 


( C2) 中 > 和 (12.2.6) 

条 件 (C1) 给 出 了 满足 完全 可 信条 件 的 最 小 观察 值 个 数 ， 而 条 件 
(C2) 给 出 了 观察 值 的 最 小 总 期 望 值 。 如 果 当 了 代表 年 索赔 次 数 时 ， 则 
(C1) 给 出 的 是 经 验 观 察 期 的 个 数 ， 而 (C2) 给 出 了 所 有 观察 期 内 发 生 索 
赔 的 期 望 总 次 数 。 如 果 互 代表 单位 时 间 同 质保 单 的 纯 保 费 , 则 (C1) 给 出 
了 最 小 的 同 质 保单 数 ， (C2) 给 出 了 所 观察 的 同 质保 单 最 小 的 期 望 总 索 
赔 额 。 


类 似 地 ， 我 们 还 可 以 得 到 完全 可 信 的 其 他 等 价 条 件 : 


(DE (12. 2.7) 
A no 
上 式 说 明 如 果 变 量 久 的 变 差 系数 CV = ao/é 不 大 于 Yn/n。， 则 经 验 数据 是 完 
全 可 信和 的 。 


(2) Yor( 束 ) = 纪 < 生 (12. 2. 8) 


这 个 公式 表明 当 六 的 波动 性 (方差) 在 一 定 范围 内 时 ， 则 可 以 认为 经 验 数 
据 是 具有 完全 信和 度 的 。 


当 义 的 分 布 未 知 时 ， 我 们 难以 确定 y 的 值 。 然 而 当 足够 大 时 ， 由 中 
心 极限 定理 ， 
Z=2-é ,N (0, 1) (12. 2.9) 
CA 





这 时 ，y, 为 正 态 分 布 的 + 分 位 点 。 通 常 我 们 使 用 p = 0.9，r = 0.05。 
此 时 ， 
ys =P (0.95) =1.645 
风 m = (yos/7)*=1 082. 41。 完 全 可 信条 件 为 : 
n>1 082.41 (ev 二) 
【 例 12 -1】 设 w 表 示 某 个 体 保单 在 单位 时 间 内 索赔 次 数 ，N 服从 泊 
松 分 布 ，E(N) =5，N,，N,，…，N, 为 其 在 过 去 相互 独立 的 4 个 观察 期 内 
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发 生 的 索赔 次 数 ， 观 察 期 n 至 少 为 多 少时 才 满 足 完全 信和 度 条 件 ? 所 有 观察 
期 内 总 共有 和 多少 索赔 事件 发 生 时 ， 才 能 使 索赔 次 数 数据 完全 可 信 ? (p= 
0.9, r=0.05)。 
解 : 由 于 WN 服从 泊 松 分 布 ， 可 以 得 到 E(N) = Var(N) ， 我 们 已 经 计算 
得 出 n=1 082.41。 
由 条 件 (C1) 知 ， 完 全 可 信和 的 条 件 为 : 
Var( N) 5 











nno =1 082.41 x 二 =216.48 
ECN) 25 
由 条 件 (C2) 知 ， Ni 完全 可 信和 的 条 件 为 : 
四 Var(N) _ Var(N) _ 
nA = nm x EEN = 1082.41 x ETH = 1082.41 


所 以 至 少 经 历 217 个 观察 期 ， 或 至 少 有 1 083 个 索赔 事件 发 生 ， 才 能 使 索赔 
次 数 数据 完全 可 信 。 读 者 可 以 注意 到 当 WN 服从 泊 松 分 布 时 ， 我 们 不 需要 泊 
松 参 数 和 A 也 可 以 计算 出 完全 信和 度 条 件 (C2)。 固 

【 例 12 -2】 设 关 表示 个 体 保单 一 次 索赔 的 索赔 额 ， 服 从 均值 为 5 的 
指数 分 布 ， 假 定 r=0.05, p=0.9, 假设 独立 同 质 保单 组 合 的 索赔 额 经 验 数 
据 为 X, ,-…,.， 求 索赔 额 的 完全 可 信条 件 (C1) 和 (C2)。 

解 : n 表示 观察 到 的 索赔 额 的 样本 个 数 ，E( 关 ) =5，Var( 耻 ) =25， 则 由 
条 件 (C1) 和 (C2),， 有 

a 082. 41 | 082. 41 
E 5 


né: 宇 1 082.41 x = 1 082. 41 x 全 = 5 412.05 
因此 ， 当 观察 到 的 总 索赔 次 数 n 大 于 1 082 时 ， 索 赔 额 经 验 数据 完全 可 信 ， 
当期 望 总 索赔 额 不 小 于 5 412. 05 时 ， 索 赔 额 经 验 数据 完全 可 信 。 
上 面 两 个 例子 分 别 说 明了 个 体 保 单 的 索赔 次 数 和 索赔 额 的 完全 可 信条 
件 ， 下 面 我 们 考虑 个 体 保单 总 索赔 额 的 完全 可 信条 件 。 首 先 回忆 一 下 第 六 
章 的 复合 分 布 的 知识 。 设 $ 表示 单位 时 期 内 的 某 保单 总 索赔 额 ，N 表示 单 
位 时 期 内 索赔 发 生 次 数 ，Y, 表示 第 i 次 索赔 额 ， 假 设 每 次 索赔 额 了 ,独立 同 
分 布 ， 且 都 与 索赔 次 数 N 独立 。 则 总 索赔 额 为 : 
S=Y +Y,+t+"* +Y, 
由 第 六 章 ， 我 们 已 经 知道 : 
E(S) =E(Y)E(N) 
Var(S) =E’(Y)Var(N) +E(N)Var(Y) 
设 5S,,… ,5S, 表示 过 去 nn 个 时 期 内 某 个 体 保单 总 索赔 额 的 经 验 数 据 ， 由 条 件 
(C1) 和 (C2) 可 以 得 到 总 索赔 额 经 验 数据 的 完全 可 信条 件 如 下 : 
Var( S$) 
"五 05) 


之 妹 








=n EY) Ver(N) NY Ye (12. 2. 10) 
[ECN)E(Y)] 


式 (12. 2. 10) 给 出 了 为 保证 过 去 总 索赔 额 完 全 可 信 所 需要 最 小 的 观察 期 。 


~ , Var(S) _ E(Y)’'Var(N) + E(N)Var(Y) 
SUN GI Te eye EC(N) ECY) 








(12.2.11) 
式 (12.2.11) 给 出 了 完全 可 信 所 需要 的 n 个 时 期 内 的 期 望 总 索赔 额 。 
另外 ， 由 式 (12. 2. 10) 有 
E’(Y)Var(N) +E(N)Var(Y) 
E’(Y)E(N) 
其 中 nE(N) 表示 n 个 观察 期 内 的 期 望 总 索赔 数 。 实 际 运用 中 ， 这 个 条 件 是 


nE(N)=n, 





用 实际 发 生 的 案 赔 次 数 来 表示 。 设 N, 表示 第 ; 个 时 期 发 生 的 索赔 数 , 用 也 入 
来 代替 过 去 个 时 期 内 发 生 的 期 望 总 索赔 数 nE(N)。 下 面 通 过 一 个 复合 泊 松 分 
布 的 例子 阐述 上 述 模 型 。 

【 例 12 -3】 设 XX,X,,…,X,,i=1,…,n 为 某 保单 组 在 过 去 nn 年 内 总 索 
赔 额 ,，X, 独立 同 分 布 ， 服 从 复合 泊 松 分 布 ，X, = Yi? + Y? +… + YY。N, 为 第 
i 年 的 索赔 次 数 ，N,,i=1,…,n 相互 独立 ， 服 从 参数 为 500 的 泊 松 分 布 ， 索 赔 
强度 为 Y，Y" 相互 独立 ， 表 示 第 i 期 内 第 j 次 索赔 额 ， 服 从 均值 为 5 的 指数 
分 布 。j =1,…,N,。 求 (1) 满足 使 总 索赔 额 完 全 可 信条 件 的 最 小 观察 年 数 ， 
总 索赔 次 数 和 总 索赔 额 ; (2) 满足 使 索赔 次 数 完全 可 信 的 最 小 观察 年 数 和 期 
望 总 索赔 次 数 ; (3) 满足 使 索赔 强度 完全 可 信 的 最 小 总 索赔 次 数 和 期 望 总 
索赔 金额 。 

解 : (1) 记 E(Y) =0,=5, Var(Y) =oy=25, 则 E(X,) =é, = 和 Aby = 
2 500，Var(X) =oxz = 和 (b+aoy) =25 000。 由 条 件 (C1) 有 : 

Ox no or 

"zm 1 FF 

即 观察 年 数 必须 大 于 5， 才能 保证 总 索赔 额 经 验 数 据 完全 可 信 。 由 条 件 
(C2) 有 


] =43 


> 让 
CT 
nA > m 到 人 = ml + =2164.8 


即 过 去 zr 年 内 发 生 总 索赔 数 必须 不 小 于 2 165， 才 能 保证 总 索赔 额 经 验 数据 
完全 可 信 。 由 式 (12. 2. 11) 
> 7) = 10 822. 
nA0, mu| 6， + ) 0 822.2 


Y 


过 去 nn 年 内 发 生 总 索赔 额 必 须 大 于 10 824.1， 才 能 保证 总 索赔 额 的 数据 完 
全 可 信 。 
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(2) 为 计算 使 每 年 索赔 次 数 达到 完全 可 信条 件 的 最 小 观察 年 数 ， 由 条 
件 (C1) 可 得 : 
S00 


x CR 
S00 





nn x Var(N)/E’(N) =no 


即 需 要 观察 至 少 3 年 。 

由 条 件 (C2) 可 得 : 
Var( N) 
ECN) 
即 在 观察 期 内 至 少 需 要 有 1 083 个 索赔 事件 发 生 ， 才 能 够 说 索赔 频率 经 验 数 
据 完 全 可 信 。 

(3) 为 使 每 次 索赔 金额 的 经 验 数 据 达 到 完全 可 信和 条件， 根据 条 件 
(C1) 和 “(C2)， 可 得 : 

0, 25 


nA 三 mm 二 =1082.41x 气 = 1 082.41 
0 5 


nA 宇 no x = 1 082.41 


2 
nAQy > 1 082.4 x = 1 082. 41 x 全 = 5 412. 05 


Y 


因此 当 观 察 到 的 期 望 总 索赔 次 数 不 小 于 1 083 时 ， 索 赔 强度 经 验 数 据 完 全 可 
信 ; 当期 望 总 索赔 额 不 小 于 5 412. 65 时 ， 索 赔 强度 经 验 数据 完全 可 信 。 是 
【 例 12~4]】 已 知 某 医疗 保险 中 每 个 被 保险 人 的 年 度 医疗 花费 经 验 平 
均 为 175， 经 验 标准 差 为 140。 现 有 一 个 团体 医疗 保险 ， 在 第 一 年 内 有 100 
个 人 投保 ， 在 第 二 年 有 110 个 人 投保 。 两 年 内 人 均 获 赔 150 元 ， 问 这 个 团 
体 经 验 数 据 是 否 满足 完全 可 信条 件 (r=0.05 p=0.9)? 
解 : 根据 已 知 条 件 ， 年度 医 疗 花费 的 期 望 和 标准 差 的 先 验 估计 分 别 为 
175 和 140。 根 据 条 件 (C1)， 可 得 完全 可 信条 件 为 : 
n> no Ea =1 028 x 140 
175 
即 至 少 需 要 693 个 被 保险 人 的 损失 数据 ， 才 能 认为 经 验 数据 是 完全 可 信 的 。 
而 经 验 观 察 人 数 为 n=n,+n,=100+110=210 人 。 由 于 210 <693， 所 以 我 
们 认为 从 观察 人 数 来 看 ,经 验 数 据 不 完全 可 信 。 量 


=692.6 





12.2.2 部 分 信和 度 


Te SA 是 SC 


当 上 例 中 的 情况 发 生 ， 经 验 数据 不 完全 可 信 的 时 候 ， 我 们 就 要 采用 经 
验 数 据 与 先 验 知识 的 加 权 值 作为 保费 的 信和 度 估 计 ， 即 


P.=zX+(1-z)M (12. 2. 12) 

其 中 0 <z<1。 此 时 称 经 验 数据 是 部 分 可 信和 的 。 
z 的 取 什 有 许多 方法 ， 本 章 的 主要 任务 是 确定 信和 上 度 因 子 z 的 取 值 。 这 里 
给 出 一 个 比较 简单 的 方法 : 有 限 波动 信和 度 法 。 在 完全 可 信条 件 中 ， 我 们 通 


过 控制 XX 的 方差 使 得 与 足够 接近 。 但 是 从 式 (12.2.8) 可 以 看 出 ， 虽 


然 无 法 保证 的 方差 足够 小 ， 但 是 控制 P, 的 方差 却 是 可 行 的 。 选 择 z 使 得 
P. 的 方差 等 于 完全 可 信条 件 时 方差 的 上 界 ， 即 
Var(P,) = Var(z¥ + (1—-z)M) =z Var( XX) -zo (12.2.13) 


0 


因此 如 果 z 比 1 小 , 则 有 z=(#c) Yn/n。， 于 是 可 以 统一 写 为 : 


:oai( 生 用 1 =min( /2 1) (12.2. 14) 
其 中 nr 是 完全 信和 度 条 件 要 求 的 最 小 观察 值 个 数 mg =m (o/E)'。 
式 (12.2.14) 中 的 第 一 等 式 的 解释 是 ， 信 和 度 因 子 z 是 完全 可 信条 件 所 
要 求 的 变异 系数 ( n/n,) 与 实际 变异 系数 的 比值 。 第 二 个 等 式 的 解释 是 
信和 度 因 子 z 是 完全 可 信条 件 所 要 求 最 小 观察 值 个 数 与 实际 样本 数 的 比值 的 
平方 根 。 因 此 有 限 波动 信和 度 法 也 称 平方 根 法 则 。 
【 例 12 -5$】 根据 例 12 -4， 求 信 度 因子 和 总 信 度 费用 。 





解 : 由 上 例 可 知 ，X =150，M = 175。 满 足 完全 可 信条 件 的 观察 人 数 
nr =692.6， 现 在 的 观察 总 人 数 为 n =110 +100 =210。 根 据 式 (12.2. 14)， 


2 _ /mn 210 
信和 度 因 子 z= I N07 B00 


于 是 信和 度 估 计 值 为 蓄 + (1 -z)M =0.55 x150 +0.45 x175 =161. 25。 本 
上 例 给 出 了 索赔 强度 部 分 信和 度 估 计 的 计算 方法 ， 我们 在 通过 一 个 例子 
考察 复合 泊 松 模型 的 部 分 信和 度 估 计 。 
【 例 12 -6】 假设 总 索赔 额 X 服 从 复合 泊 松 分 布 ， 索 赔 次 数 的 参数 为 
和 A， 个体 索赔 额 的 均值 为 6,， 方 差 为 ao;, 设 针 ,…,X, 是 nn 个 时 期 内 的 总 索 
赔 额 观 察 值 ， 求 其 信和 度 因 子 。 
解 : 利用 复合 泊 松 分 布 的 先 验 均 值 和 方差 公式 计算 得 到 : 
££=E(X) =A0, 
0 =Var(X) =A(0, +ay) 
代入 式 (12. 2.14) 得 : 


:=min[ ne 1 -min a !| (12.2. 15) 
OAl no 1 +oy/Oy 
国 
【 例 12 -7】 假设 总 索赔 额 站 服 从 复合 泊 松 分 布 ， 其 中 索赔 额 变 量 服 
从 指数 分 布 。 某 投保 团体 过 去 ”个 时 期 总 索赔 额 分 别 为 站， 五 ，…， 艺 ， 
{ZX} 是 相互 独立 。 假 设 索赔 次 数 数 据 的 可 信和 度 因 子 为 0.9， 求 总 索赔 额 数 
据 了 X,，X, ，…，X, 的 信和 度 因 子 。 





* 285.: 


精算 模型 


286 . 


解 : 设 该 团体 在 过 去 n 个 时 期 的 索赔 次 数 为 Ni，N,，…，N,， 由 于 索 


赔 次 数 服 从 参数 为 A 的 泊 松 分 布 ， 因 此 由 泊 松 分 布 的 信和 度 公 式 知 za = 


F 





= ps = /和 2 =0.9， 即 An/n, =0.81。 因 为 索赔 额 变量 服从 指数 分 布 ， 
0 0 
所 以 gy = 09,o 设 X,， a 及 。 的 信和 度 因 子 为 z， 则 由 式 (12. 2. 15) 知 ， 


7 
z=min| /2 ,1 -min| OR 1 =0. 6364 加 
1 +oy/0y 1 十 1 


值得 注意 的 是 ， 虽 然 用 有 限 波 动 方法 可 以 得 到 简明 的 解决 方案 ， 但 在 
理论 上 却 不 能 自圆其说 。 首 先 ， 这些 久 的 分 布 没 有 潜在 的 理论 模型 支持 ， 
因此 没有 明确 证 明 为 什么 信和 度 保 费 形式 (12.2.12) 是 恰当 的 ， 并 且 更 优 于 
M。 其 次 ， 即 使 对 特定 模型 而 言 式 (12. 2. 12) 是 恰当 的 ， 但 却 对 如 何 选择 
r 和 和 p 没有 提出 任何 建议 。 最 后 ， 有 限 波动 方法 没有 考虑 & 和 MM 之 间 的 差 
别 。 当 运用 式 (12.2.12) 时 ， 本 质 上 是 认为 M 能 够 精确 地 代表 在 没有 任 
何其 他 信息 的 条 件 下 某 被 保险 人 的 期 望 损失 ， 然 而 , M 本 身 常常 也 是 一 个 
估计 值 ， 因 此 并 不 够 可 靠 。 所 以 ， 正 确 的 信和 度 问 题 的 提 法 应 该 是 “与 M 相 








比 ， 态 的 可 靠 程度 增加 了 多 少 ?” 而 不 是 “ 有 多 可 靠 ?”。 

本 章 下 面 将 介绍 贝 叶 斯 建 模 方法 。 它 是 基于 特定 被 保险 人 的 索赔 历史 
数据 ， 并 指出 过 去 数据 与 预期 费 率 的 厘定 相关 。 在 一 定 条 件 ， 可 以 证 明 信 
度 保费 形式 (12. 2. 12) 是 合理 的 ， 只 是 z 的 取 值 为 男 一 种 形式 。 


$12.3 中 时 斯 信 度 


12.3.1 预测 分 布 


正如 我 们 在 上 节 中 所 提 到 的 ， 虽 然 经 验 数据 X 和 手册 保费 M 的 加 权 形 
式 直观 上 有 助 于 提高 估计 的 精度 ， 然 而 并 没有 明确 的 理论 证 明 这 种 形式 是 
恰当 的 。1967 年 ，Biihlmann 提出 建立 在 贝 叶 斯 理论 基础 上 的 最 大 精度 信 度 
模型 ， 又 称 Bahlmann 信 度 ,给 出 了 信和 度 的 理论 基础 。 为 了 更 好 地 理解 
Biihlmann 信 度 ， 我 们 先 简单 介绍 一 下 贝 叶 斯 理论 在 信 度 中 的 应 用 。 


假设 我 们 已 知 过 去 的 二 个 经 验 数据 闷 = | 针 ,X,,…,X,| 的 观察 值 *= 
fx,，z;，,…,%,|} ， 希 望 预测 将 来 的 数据 X,,,。 此 外 ， 我 们 还 知道 被 保险 人 风 
险 的 先 验 信息 0。 虽然 在 厘定 级 别 费 率 时 ， 我们 已 经 考虑 了 被 保险 人 的 若干 
风险 因子 ， 然 而 这 些 风险 因子 无 法 完美 刻画 被 保险 人 的 风险 。 我 们 用 9 描 
述 那 些 剩余 的 、 未 被 观察 到 的 、 影 响 风险 水 平 的 因素 ,这样 风险 子 集 的 某 
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一 个 被 保险 人 的 风险 水 平 可 以 通过 一 个 参数 9 来 描述 。9 的 取 值 随 被 保险 人 
的 不 同 而 不 同 ， 也 就 是 说 ， 通 过 不 同 取 值 9， 我 们 可 以 区 分 不 同 被 保险 人 的 
风险 水 平 的 差异 。 例 如 ， 在 车 险 中 ,可 以 用 不 同 的 值 表 示 车 主 的 责任 心 、 
驾驶 技巧 等 风险 特征 。 我 们 通常 假设 6 的 存在 性 ， 但 是 我 们 还 进一步 假设 6 
是 不 可 观察 的 ， 因 此 我 们 永远 不 知道 9 的 真实 值 。 

由 于 6 随 被 保险 人 变化 ， 因 此 ， 在 风险 子 集 内 存在 一 个 关于 9 的 概率 
分 布 r(6) 。 每 个 被 保险 人 的 具体 风险 参数 9 的 值 都 是 未 知 的 ， 我 们 视 9 为 
随机 变量 @ 的 观察 值 。 如 果 9 是 标量 ， 则 @ 的 累积 分 布 函数 上 (6) = P(@ 
< 拓 g) 可 以 看 做 风险 子 集中 风险 水 平 小 于 或 等 于 9 的 被 保险 人 的 比例 。 在 本 
节 中 ， 我 们 假定 7(9) 是 已 知 的 ， 并 称 其 为 先 验 分 布 或 结构 分 布 。 

不 同 的 9 对 应 不 同 的 风险 ， 由 经 验 数 据 生体 现 为 不 同 的 损失 水 平 。X 
关于 9 的 条 件 分 布 密 度 为 fi (x |19) ,j=1,…,n, XX 关于 0 的 条 件 已 (站 = 元 | 
@ =9) =fi,。(%|9)。 这 里 用 向 量 形式 表示 经 验 数据 。 过 去 损失 与 将 来 损 
失 关 于 过 去 数据 的 联合 条 件 概率 函数 表示 为 户 ，,。(Z，x,,,19) 。 

已 知 先 验 分 布 r(9) 及 条 件 分 布 户 。(x16)， 则 6 和 天 的 联合 分 布 

fie (x, 0) =7(0) xfi,。 (x|0) (12. 3. 1) 
进而 ， 对 @ 的 所 有 可 能 取 值 积分 得 到 匀 的 边际 密度 (如 果 @ 的 先 验 分 布 是 
离散 的 ， 则 求 和 ) : 

万 (2) = | 启 。( 王 19) x (0)do 
或 f(x) = > frol*|0) x 7(0) (12.3.2) 
同样 ， 我 们 也 可 以 求 得 藉 与 忒 ,的 边缘 密度 函数 : 


fix, (xx ) = | a (on 19) x 7(0)d9 (12. 3.3) 


进而 ， 我们 可 以 求 出 XX,,, 关 于 关 的 条 件 分 布 ， 称 为 预测 分 布 : 


2 Six (xX, Xi) 
fx 3 n+l x) nt 
a | f(x) 


注意 ， 当 凶 与 ,| 关于 0 条件 独 立时 , 无 与 蕊 ,的 边缘 密度 函数 可 表示 为 : 


(12. 3. 4) 


fi (Xsan ) = [folx10) xfielxn|0) xm(6)d6 (12.3.5) 
于 是 预测 密度 可 以 写 为 : 


2 es ntl ,%) 
fei Ci | X) = we 
fi(x) 


到 人 6) x mox(0|x)d0 (12. 3. 6) 


" 287 ， 


288 . 


这 里 5 
Hg,z) Sy fuelxil 09) x 7(0) 


moi(0|x) 
fr xi) [fe lz10) x 7(0)d0 





是 风险 参数 @ 的 后 验 分布 ， 而 预测 分 布 是 后 验 分布 与 条 件 分 布 的 乘积 的 积 
分 或 求 和 。 这 在 直观 上 也 是 很 容易 理解 的 ， 因 为 式 (12.3.6) 就 是 以 经 验 
数据 为 条 件 的 全 概率 公式 。 

需要 注意 是 ， 上 式 成 立 的 条 件 ， 被 保险 人 的 经 验 损失 和 预测 损失 之 间 
需要 关于 风险 参数 9 条 件 独 立 ， 这 在 实际 中 很 常见 。 如 果 条 件 独 立 不 能 满 
足 ， 我 们 不 能 直接 应 用 式 〈12.3.6)， 而 需要 根据 情况 从 式 (12.3.4) 推 
导 。 经 验 数据 不 需要 与 预测 数据 无 条 件 独 立 ， 事 实 上 具有 相同 风险 特征 的 
保单 的 损失 数据 之 间 也 往往 不 是 无 条 件 独立 的 。 

【 例 12 -8】 假设 某 保险 公司 承保 的 业务 中 ， 有 1/3 的 保单 的 月 损失 
次 数 服 从 均值 为 4 的 泊 松 分 布 ， 有 273 的 保单 月 损失 次 数 服从 均值 为 2 的 
泊 松 分 布 ， 且 同一 张 保 单 月 的 损失 次 数 是 独立 的 。 对 于 一 个 随机 抽取 的 保 
单 ， 已 知 观察 到 上 个 月 的 损失 次 数 为 1。 求 这 个 月 此 保单 损失 1 次 的 概率 。 

解 : 根据 题 意 ， 先 验 分 布 

1 


(9) ~ 

a 一 

2 0=2 
3 e 


泊 松 参数 为 均值 ， 条 件 分 布 为 fr,。(k19) = 局 e…， 5 为 非 负 整数 。 于 是 根据 
全 概率 公式 求 得 上 个 月 损失 次 数 为 1 的 概率 为 : 


1 
fr(1) = > fx |0) x Te(O) a we +—e” Xx = 0. 205 
6 


1 
1! 3 1! 3 
同样 我 们 可 以 求 出 上 个 月 和 这 个 月 损失 次 数 都 为 1 的 概率 : 
fen(1s1) = DB fen(msm|0) xme(g) 
由 于 对 于 同 张 保单 ， 上 月 的 损失 次 数 与 这 个 月 的 损失 次 数 是 独立 的 ， 
所 以 上 式 写 为 : 
A190) x 大 (mm 169) xme(9) = (er) x 委 + (和 7) x 地 
= 0.051 
于 是 可 以 求 出 条 件 分 布 : 


fxr,x(1,1) 0.051 
fi(1) 0.205 


于 是 ， 对 于 上 个 月 损失 1 次 的 保单 ， 这 个 月 也 损失 一 次 的 概率 为 0.247。 是 
注意 ， 我 们 也 可 以 通过 后 验 分 布 求 预测 分 布 。 经 计算 其 后 验 分 布 为 : 





P(X,=1|X,=1)= =0.247 


0. 88 ， 0 =2 


To1x (011)= 
om (0| 12 ， 0=4 


P(X,=1|X =1) 


> fee CX | 0) x Trex. (0 | x ) 


Hi 


2 ex0.88 + (4e) xol2 = 0.247 
人 


【 例 12 -9】 已 知 某 险种 保单 的 被 保险 人 的 每 次 索赔 额 服从 均值 为 1/@ 
的 指数 分 布 ，@ 为 随机 变量 ， 服 从 均值 为 0.004， 方差 为 4x10“ 的 件 玛 分 
布 。 已 知 同一 保单 过 去 三 次 的 索赔 数据 分 别 为 100，950 和 450。 求 @ 的 后 
验 分 布 以 及 此 保单 下 一 次 的 索赔 额 的 预测 分 布 (已 知 同一 保单 的 每 次 索赔 
之 间 独 立 ) 。 

解 : 设 伽 玛 分 布 的 参数 为 w，B， 则 由 伽 玛 分 布 的 期 望 ge， 方 差 为 aB? ， 
可 得 参数 a =4，B =0.001。 从 而 先 验 分 布 为 : 


(86/B) “e -8/8 Oe! 0 000° 
= = > 06>0 
9 oT'(a) 6 


由 题 知 ， 条 件 概 率 服从 指数 分 布 ,为 i。(x|10) = be “。 由 后 验 分 布 的 公 
式 得 : 





Toi(8|100, 950, 450) fe(%,0) 

fi Cx) 

De 0+450) Gre!™%%1 000°/6 

S fi (2) 
注意 到 分 母 为 经 验 损失 的 边缘 分 布 ， 是 一 个 与 参数 6 无 关 的 值 ， 将 其 与 分 
子 中 常数 统一 用 常数 C 表示 ， 则 可 以 得 到 : 
meiz(0|100,950,450) =Cxe 0 oe eg 
由 于 上 式 为 密度 函数 ， 所 以 积分 为 1， 可 求 出 上 式 的 常数 C。 又 从 

Tex(0|100, 950, 450) 的 形式 可 以 看 出 ， 其 对 应 的 正好 是 参数 为 7 和 
0. 0004 的 何 玛 分 布 ， 因 此 不 需要 积分 ， 直 接 可 以 获得 风险 参数 的 后 验 分 
布 为 : 








7 96 , -2 5008 
Tezi(8|100,950 ,450 ) = 一 


进而 ， 根 据 式 〈12. 3.6) ， 可 以 求 得 预测 分 布 : 


fuilx|100,950,450) = [六 lex19) x me |i(0|100,950,450) dg 
8 


E Ee Oe™ 2 500’ 
rT(7) 
_ 2500 x7 
(2 500 + x)’ 


dO 


0 


289 ， 


服从 参数 为 7 和 2 500 的 帕 票 托 分 布 。 
定义 12 -1 如 果 参 数 9 的 后 验 分 布 与 先 验 分 布 具有 相同 的 形式 ， 只 是 
参数 不 同 ， 则 称 此 先 验 分 布 为 给 定 模 型 的 共 白 先 验 分 布 。 
【 例 12 -10】 设 8 的 先 验 分 布 7(96) 为 贝塔 分 布 B(a,5)， 义 关于 98 的 
条 件 分 布 为 二 项 分 布 B(m,9) ， 证 明 B(c,8) 是 共 斩 先 验 分 布 。 
解 : 由 于 foe(x|10) =C50 (1-0)"” ,x=0, 1, 2,.…,m 
7(0) cg (1-9) 
所 以 ， 
f(0,x%) 0° (1 -0 0 (1 -0)"*=0°" (1 0" 
由 于 f(x) 不 受 9 影响 ， 因 此， 


_/A0,x) atz-l mtb-r-l 本 
| Bl(a+rxm+b—x) 


所 以 条 件 分 布 为 二 项 分 布 时 ，B(c，8) 是 共 斩 先 验 分 布 。 
关于 共 斩 先 验 分 布 ， 可 以 证 明 下 面 的 结论 : 
定理 12 -1 设 {XX,j=1,…,n| 关于 98 条 件 独立 , 分布 密度 函数 具有 
如 下 的 形式 : 





_p(x)e™ 
fue (x | 0) > gq(0) 


且 当 参数 9 取 有 限 实 值 时 ， 其 先 验 分 布 满足 如 下 形式 : 


_ [gq(0)] ee ” 
Ta c(1,k) 


其 中 人 , 为 分 布 的 参数 。 则 参数 g 后 验 分 布 与 先 验 分 布 共 恩 。 
表 12 -1 是 一 些 常见 的 共 恩 分 布 ， 请 读者 自己 验证 。 














表 12 - 工 常见 共 斩 分 布 
条 件 分 布 共 轿 先 验 分 布 后 验 分 布 
泊 松 分 布 P(@) 做 玛 分 布 (c，A) 伽 玛 (a +nz, n+ 和 A) 
二 项 分 布 8 (nm，@) (随机 参数 为 @) 贝塔 分 布 B8 (a, 6) 贝塔 (a +x, n+b -x) 
均值 为 @ 的 指数 分 布 做 玛 分 布 (a，X) 分 玛 (a +nz, n+A) 
均值 为 1/@ 的 指数 分 布 逆 爷 玛 分 布 IT(a，X) 逆 伽 玛 (Qa +nz, n+ 和 A) 


12.3.2 贝 叶 斯 信和 度 估计 


FT FU er Sr 


现在 回 到 前 面 的 问题 ,已 知 过 去 的 久 个 经 验 数 据 于 = {XX ,X,,… ,了 ,| 
的 观察 值 *= {x ,x,,… ,x,} ， 预 测 下 一 期 的 损失 数据 X,,,。 假 设 当 风险 参 
数 @ =9 给 定时 的 耻 ,,, 的 条 件 分 布 为 ,elx,,19)， 则 最 理想 的 情形 是 9 已 
知 ， 下 期 的 期 望 损失 为 条 件 期 望 败 ,, (8) = E(X,,, | 8 =0)， 这 样 得 到 的 预 
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测 值 称 为 个 体 估计 值 。 然 而 对 每 个 特定 的 被 保险 人 ，9 是 不 可 观察 的 。 若 
我 们 对 9 和 经 验 数据 一 无 所 知 ， 则 认为 下 期 的 期 望 损失 为 无 条 件 期 望 ， 即 
E(X,,) = ELE(X,,,| 9)]， 这 样 得 到 的 预测 值 称 为 集体 估计 值 。 一 般 情 况 
下 ， 我 们 对 9 是 有 一 定 先 验 认识 的 。 假 设 我 们 已 知 9 的 先 验 分 布 (9) ， 并 
假设 该 被 保险 人 的 过 去 损失 经 验 独立 ， 即 给 定 @ = 9 时 ，X,，X,，…,X, 是 
独立 的 ， 则 由 前 面 知 ， 我 们 可 以 利用 过 去 的 经 验 数据 对 该 被 保险 人 明年 的 

损失 X,., 进 行 估计 ， 即 使 用 预测 分 布 的 期 望 什 
Ee ey | re a 

这 样 得 到 的 估计 值 ， 称 为 贝 叶 斯 信 度 估计 值 。 
进一步 ， 由 式 (12. 3. 6) ， 贝 叶 斯 信 度 估计 值 可 写 做 : 


E(X,,, 1X = 这) = } Xn X fxr Xa | x) dx,,, 


+l1 


| 区 ax1 Xfix (x, Xa ) dx 
六 


f(x) 





也 可 以 用 预测 分 布 写 为 : 


E(X,, |X 3 x) 地 区 X fr zl Xn | x) dx,,, 
pp 


Xr xX | 二 | 0) x Toi(0 | x) dbdx 
8 


x 
二 | | | x fr el Xan | 0) dx,, x Tear(0 | x) do 
© x 
| 2Cx 10) x Tox(0|x)d0 (12. 3.7) 
8 


当 @ 服从 离散 分 布 时 ， 
BE(X |X = 23) = DEX, |0) xmez(g|12) 
需要 注意 的 是 ， 式 (12.3.7) 与 式 (12.3.5) 建立 在 同样 的 假设 上 : 
对 于 相同 经 验 损失 数据 和 预测 损失 关于 风险 参数 的 条 件 分 布 是 独立 的 。 
【 例 12 -11】 承 例 12 -8，, 求 此 被 保险 人 这 个 月 损失 的 预测 分 布 和 贝 
叶 斯 信和 度 估计 值 。 
解 : 我 们 已 经 求 得 后 验 分 布 : 
0.88,0=2 
0.12, 09=4 
根据 式 (12. 3. 6) 和 (12. 3.7) ， 可 以 得 到 预测 分 布 和 贝 叶 斯 信 度 估计 值 : 
foxl%|1) = fiolx! 0) xmen(9|1) 


meix. (011) -| 


= 0. 88 x 二 + 0. 12 x 人 
x! x! 


精算 模型 
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E(K |X =1) = 5 EX, |0) xmex (0|1) =2x0.88 +4x0.12 =224 
8 


【 例 12 -12】 承 例 12 -9, 已 知 单 笔 索 赔 额 服从 均值 为 1/8 的 指数 分 
布 ， 所 有 被 保险 人 的 @ 服从 均值 为 0.004、 方 差 为 4x10 ”的 佩 玛 分 布 。 已 . 
知 同一 保单 过 去 三 次 的 索赔 数据 分 别 为 100，950 和 450。 求 此 保单 下 一 次 
索赔 额 的 贝 叶 斯 信和 度 估计 值 (已 知 同一 保单 的 每 次 损失 之 间 独 立 )。 


2 500" x7 
(2 500 +X) 


从 参数 为 7 和 2 500 的 帕 累 托 分 布 。 根 据 帕 累 托 分 布 取 期 望 ， 得 到 贝 叶 斯 信 
度 估计 值 : 


E[X,|¥=(100, 950, 450)] = 





解 : 我 们 已 经 求 得 预测 分 布 户 rz(x* |100，950，450) = 服 


2 500 
7 -1 
注意 ， 若 去 掉 风险 参数 9 的 随机 性 ， 直 接 对 条 件 期 望 E(X,,, | 8) 再 取 
1 


期 望 ， 得 到 无 条 件 期 望 为 E(X,.,) = E。[E(X,,, |8)] =E| 百 ) =333.3。 另 
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外 ， 直 接 求 经 验 数据 的 平均 值 ， 得 到 X = 500。 比 较 贝 叶 斯 信 度 估计 值 、 集 
体 估计 值 和 个 体 经 验 均 值 ， 可 以 发 现 贝 叶 斯 信 度 估计 介 于 两 者 之 间 。 

【 例 12 -13】 有 某 类 团 险 保单 组 ， 在 第 /年 有 m, 个 被 保险 人 。 假 设 每 
位 被 保险 人 的 年 索赔 次 数 相互 独立 ， 且 服从 参数 为 9 的 泊 松 分 布 。 风 险 参 
数 @ 服从 人 血 玛 分 布 : 


Ole™ 


7(0) -TOay Be 0>0 


每 人 每 次 索赔 额 都 为 常数 ， 每 年 以 100r% 的 通货 膨胀 率 递增 。 若 第 0 年 的 
每 次 索赔 额 为 c 元 ， 则 在 第 :年 的 每 次 索赔 额 为 (1 +r)'c。 设 各 年 每 张 保 单 
的 人 均 纯 保费 等 于 该 年 人 均 总 索赔 额 期 望 值 。 已 知 保单 组 在 第 n+1 年 该 团 
体 有 mm, 个 被 保险 人 ,求人 均 纯 保费 的 贝 叶 斯 信和 度 估 计 值 。 

解 : 在 第 j 年 的 保单 组 的 总 索赔 次 数 为 W， 服 从 参数 为 m6 的 泊 松 分 
布 ， 即 
(m0)"e 一 mig 

nl! 
设 如 表示 该 投保 团体 在 第 7 年 的 人 均 年 总 索赔 额 ， 
X=e(l +r)N/m,, j=1,2,°…,n 
因此 ,XX 的 条 件 分 布 为 : 
fuelxi|0) =P(N=c (1 +r) "mx,|© =0) 


P(N,=n|@=0)= n=0, 1, 2, … 


Lm0] "0 me ~ m0 
[ei(l1+r) ra] ! 


则 (XX ,了 ,,… ,了 XY,, 昌 ) 的 联合 分 布 密度 为 : 


上 户 。(Cxz10) = (I /sex;|0)) (0) 
@ 的 后 验 分 布 为 : 
a fielx | 60) 
ix(0 ) = 一 
I 5 fx (x) 
( II [m0] TU 5e -md ) ge 


[e™ (1 +r) “mx,] ! x T(a)pB” x fi 





> a 
= ge (en ms-! eo -0( 广 + Em") 
示 


从 后 验 分 布 的 形式 可 以 看 出 ，ref(9|xz) 是 一 个 参数 为 


Qe 。 a (1 + rT) mx, B. = (5 Dm,) 


的 伽 玛 分 布 。 另 外 ，XX, 的 条 件 期 望 为 : 


E( 天 19=9) =E( i |e-0) -e+n)’ 


因此 ,n+1 年 的 人 均 风 险 保费 为 ,4(90) =c (1 +r)"*9， 人 均 纯 保 费 为 : 
pn =E(p(O)) =e (1 +r)""ap 
由 式 (12.3.7) 计算 人 均 贝 叶 斯 信和 度 估 计 值 为 : 


ECX | = x) = | pn(0) mo|i(0|)d0 
sn 


= 已 (0 (6) | = x) 


li 


E(c(1 +7r)""Q | 勾 = x) 
c(1 +r)""a.B. 


事实 上 ,车 令 m= 六 m 为 n 年 内 该 团体 的 投保 总 人 数 ， 则 经 过 简单 的 
代数 运算 可 以 得 到 : 
E(X,,, |¥=%) =zx+(1-z) py, 


n 


其 中 , z=m/(m+B ),x = m 2》 (1 +7r)" mx;。 若 将 视 为 该 团体 在 
年 内 的 经 验 保 费 ， 则 贝 叶 斯 信和 度 估计 值 可 以 看 做 是 该 团体 经 验 人 均 保 费 与 
人 均 纯 保费 的 加 权 平 均 。 国 


贝 叶 斯 信和 度 估 计 的 做 法 是 用 经 验 数 据 的 信息 代 兰 风险 参数 ， 求 E(XX,,, 


| 钱 =%) 。 从 直观 上 ， 我 们 可 以 想象 贝 叶 斯 信和 度 估计 值 优 于 条 件 期 望 的 期 
望 ， 因 为 它 更 加 充分 地 利用 了 已 知 的 信息 。 事 实 上 ， 贝 时 斯 信 度 估计 值 
是 所 有 利用 经 验 数据 估计 X,,, 中 误差 最 小 的 估计 量 ， 见 下 面 的 定理 。 


定理 12 ~2 在 所 有 利用 XX 来 估计 X,,, 的 估计 量 中 ， 贝 叶 斯 信和 度 估计 值 
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的 均 方 误差 最 小 ， 即 E11[X,,, -E(X,,, | 六 ) ] ”1 小 于 任何 其 他 估计 量 的 均 方 
误差 。 
证 明 : 记 X,,, 的 任 一 估计 量 为 ag( 关 )， 则 其 均 方 误差 为 : 


Q,=E{[X,,, -g(X)]’! 


” 贝 叶 斯 信和 度 估计 值 的 均 方 误差 为 : 
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El[X.., —E(X.., |X)]} =E{X:,, ~-2X,E(X,, |X) +E’(X,,, |X)! 
=E(X,) -2E[X,,E(X,,, |X)] + ELE’(X,,, |X)] (12. 3. 8) 
由 期 望 的 迭代 法 则 ， 可 将 第 二 项 
E[ XE(X, |X)] =E{ELX,.E(X,,, |X)] |X} 
=E{E(X,,, | X)E(X,,, |X)] (12. 3.9) 
注意 最 后 一 个 等 式 成 立 是 因为 E(X,,, |X) 可 看 做 是 随机 向 量 针 的 函数 ， 因 
此 当 对 无 (下 ,| 部) 关于 对 量 条 件 期 望 时 ， 由 条 件 期 望 的 性 质 ? 可 得 。 


由 式 (12. 3.8) 和 式 (12. 3.9) 有 
E{[X.,, -EC(Y,,, |X)]*} =E(X,,) ELE (X,,, |X)] 


=E(X,,) -2E[g(X)X,,] +2E[e(X)X, 1] +Elg (X)] -Elg (X)] -ELE(X,., |X)] 

=El[X,,, -g(X)]’} -Elg (X)] +2E[g(X)X,.,,] -ELE’(X,,, |X)] 

=E{[X., ~g(X)] | -Elle(X) -ECX,,, |X)]*| 

=Q, -El[e(X) -EC(X,,, |X)]"| 
所 以 ,，E{[X,,, -E(X,, | XJ <Q, 

虽然 贝 叶 斯 信和 度 估计 值 相 对 而 言 比 较 精 确 ， 但 是 它 的 计算 方法 比较 因 

难 ， 计 算 过 程 中 需要 多 次 用 到 积分 。 虽 然 前 两 个 例子 都 可 以 很 快 的 计算 出 
结果 ， 但 是 实际 应 用 中 会 遇 到 更 加 复杂 的 分 布 ， 有 时 还 要 用 到 数值 积分 的 


方法 。 为 了 得 到 较为 简便 的 结果 ，Biihlmann (1967)@ 提出 用 克 的 线性 函 
数 天 = m + 了 ww 为 来 通 近 几 , (6) ， 其 中 mm，w，…，w 为 要 确定 的 参 
数 。 选 择 系数 的 原则 是 使 估计 的 均 方 误差 最 小 化 ， 即 最 小 化 

0 =- [ws(e) - (m+ Dok)] (12. 3. 10) 


注意 到 这 里 的 0 中 的 随机 变量 除了 天 还 包含 @， 因 此 式 (12. 3.10) 





Q@ 这 里 用 到 了 条 件 期 望 的 性 质 : 设 X 和 了 是 任意 两 个 可 积 随机 变量 ，g(. ) 是 一 个 函数 ， 使 得 B[s 
(了 )] ,EL[Xg(Y)] 存 在 , 则 E(Xe(Y) |Y) =g(Y)E(X |Y)。 关 于 这 个 性 质 的 证 明 可 参考 严 士 健 、 刘 秀 劳 : 


《概率 与 测度 》， 北 京师 范 大 学 出 版 社 2003 午 版 ,第 271 页 。 
©® Bihlmann, H. (1967), “Experience Rating and Credibility,” ASTIN Bulletin, 4, 199 ~207. 


的 期 望 是 针对 所 有 的 蕊 ， X,,…,X, 和 @。 
为 最 小 化 式 (12. 3. 10) ， 我 们 可 以 通过 对 所 有 的 待定 参数 a。，a,,…， 
a, 求 偏 导 ， 令 其 等 于 0， 得 





9 co 


ey NG 了 这 “人 交合 


区 


& j=1 
在 上 面 的 公式 中 ,El[p,.,(@)] =E[ELX,,,|@]] =E(X,,,) 
根据 式 〈12.3. 11)， 可 以 得 到 : 





E(X.,) = Q， + > QE(X,) (12. 3. 13) 


和 


式 (12.3.13) 说 明志 ,是 和 的 无 偏 估 计 ， 通 常 称 为 无 偏方 程 。 式 
(12.3. 12) 中 的 

E[ Xp (OB)] =E{ELX 1,..(O) | OO]}=E[E(X,| @)E(X,,,|O)] 
在 每 次 损失 条 件 分 布 独立 的 情况 下 ， 

E[X,p..(O)] =ELE(XX,. |O)] =E(X.X,,) 
所 以 式 (12. 3. 12) 可 以 化 简 为 : 


E(XX,,) = GE(X,) + 了 QE(XX,) (12. 3. 14) 
把 式 (12. 3. 13) 两 边 乘 以 E(X,) ， 然 后 与 式 (12. 3. 14) 相 减 得 : 
Cov( X,,X,.,) = Dy QCov( XX,) ， i=1,2,.,n (12.3.15) 
上 式 组 成 正 交 方程 组 ， 可 以 写 为 : 
Coo(X, Xu) = oy 
其 中 三 为 协 方差 阵 。 研 非 奇异 时 ，& = Cov ( 匀 ,X,,1) 于 1。 
下 面 两 条 定理 将 说 明 ， 这 种 Bihlmann 线性 估计 不 但 是 对 E(X,,, | @) 


的 线性 估计 中 均 方 误差 最 小 估计 ， 也 是 X,,, 和 贝 叶 斯 信和 度 估计 值 的 最 小 误 
差 线性 估计 。 

定理 12 -3 Biihlmann 线性 估计 在 所 有 用 针对 X,,, 的 线性 估计 中 均 方 
误差 最 小 。 


证 明 : 苹 对 X,,, 的 任 一 线性 估计 为 a。+ 》 ajX, ， 其 均 方 误差 @,，= E 


sal 


[Xi - (am + 本 a)] 。 对 0, 求 偏 导 ， 得 





3 -28[Xw] +2B[(oo + DX)] i 
30Q， 
= 2E{X[L X,,, 一 ao 一 2 
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精算 模型 
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= 2E(XX,) -2[aoE(E) + 和 aE(ZE)] = 1,2,… (12.3.17) 


显然 二 阶 偏 导数 抢 阵 是 正定 的 。 从 式 (12.3.16) 和 (12.3.17) 可 以 
看 出 ， 当 a,=a,, i=0,-…,n 时， 等 于 0。 因此 Biihlmann 线性 估计 在 所 


有 用 成 对 互 ,, 的 线性 估计 中 均 方 误差 最 小 。 


定理 12 -4 ”Bihlmann 线性 估计 在 所 有 用 针对 贝 叶 斯 信和 度 估 计 值 的 线 
性 估计 中 均 方 误差 最 小 的 。 

证 明 : 证 明 过 程 与 定理 12 -3 类 似 ， 请 读者 自行 证 明 。 

综 上 所 述 ， 上 面 得 到 的 Bihlmann 线性 估计 很 好 的 性 质 ， 它 对 E(X,,， 
18)、,,, 和 贝 叶 斯 信和 上 度 估计 值 的 最 好 的 线性 估计 ， 下 节 要 介绍 的 
Biihlmann 信 度 模型 及 其 扩展 都 是 上 述 Bihjmann 线性 估计 的 特殊 形式 。 


$12.4 最 六 精度 信和 度 模型 


在 上 节 中 我 们 推导 出 了 Bihlmann 线性 估计 是 对 E(X,,, | @)、 蕊 ,和 由 
叶 斯 信 度 估计 值 均 方 误差 最 小 的 线性 估计 形式 。 本 节 将 在 一 些 特殊 的 假定 
下 ， 推 导出 线性 估计 的 具体 形式 。 我 们 将 会 发 现 ， 这 种 线性 估计 形式 最 终 
可 以 写 为 经 验 估计 和 先 验 估计 的 信 度 加 权 形 式 。 这 个 信 度 因子 称 为 
Biihimann 信和 度 因 子 。 由 于 Bihlmann 信和 度 估 计 是 均 方 误差 最 小 的 估计 ， 因 
此 也 被 称 为 最 大 精度 信和 度 模型 ， 或 一 致 最 精确 信 度 。 

沿用 上 节 的 记号 和 假设 。 假 设 每 一 份 保单 对 应 一 个 风险 参数 ， 风 险 参 
数 是 一 个 随机 变量 @， 而 且 @ 的 取 值 是 无 法 观察 的 ， 但 可 以 知道 风险 参数 
@ 的 先 验 分 布 。 损 失 了 外 是 一 个 随机 变量 ， 对 于 @ 的 每 一 个 具体 值 9， 对 应 
一 个 互 的 条 件 分 布 太 ,。(x |16)。 对 于 一 个 给 定 的 6， 每 次 损失 的 条 件 分 布 
X, 19 是 独立 的 。 


12.4.1 Biihlmann 模型 


Er A 


Bablmann 信 度 是 最 时 使 用 的 ， 也 是 最 简单 的 最 大 精度 信 度 模型 。 它 候 
设 对 于 给 定 的 风险 参数 ， 每 次 损失 的 条 件 分 布 是 同 分 布 的 。 因 此 每 次 损失 
的 条 件 均值 和 条 件 方 差 是 相同 的 ， 用 数学 符号 表示 为 : 
H(9) =E(X.|®=0); v(0) =Var(X,|©=0) 
注意 (9) 和 w(9) 随 6 变化， 因此 可 以 看 做 9 的 函数 。 因 为 @ 是 随机 变量 ， 
所 以 (98) 和 wvw(@) 也 是 随机 变量 ,我 们 可 以 对 它们 取 均 值 和 方差 ， 记 : 
x=E[1(O)], v=E[v(@)], a=Varlu( ©)] (12.4.1) 
式 (12.4.1) 中 的 几 称 为 条 件 期 望 的 期 望 。 根 据 条 件 期 望 迭 代 法 则 ， 


可 证 明 j=E(X,)， 是 没有 任何 关于 8 的 信息 下 的 所 用 的 估计 量 。 式 
(12.4.1) 中 的 uv 称 为 条 件 方差 的 期 望 ， 也 称 组 间 方 差 的 期 望 ; a 称 为 条 件 
期 望 的 方差 ， 也 称 各 组 均值 的 方差 。 根 据 方 差分 解 公 式 可 知 : 
Var(X,) =Var[ E(X.|@)] +E[Var(X.|@)]=atv (12. 4.2) 
从 式 (12.4.2) 知 ， 关 的 方差 可 以 分 为 两 部 分 : 组 间 方 差 的 期 望 ” 和 
各 组 均值 的 方差 a。 
Cov(X,,X,) =E(XX,) - E(X.)E(X,) 
=E[E(XX,|@)] -EL[E(X.|@)]ELE(X,|©)] 
利用 X, | 9 是 条 件 独立 的 ， 上 式 等 于 
E[E(X,| @)E(X|@)] -ELE(X|@)] ELE(X,|O)] 
=E[y (@)] -EFE[x(Q)] 
=Varlu(@)]=a (12.4.3) 
根据 上 面 的 分 析 ， 我 们 记 E(X,) =4,Var(X,) =a +v,Cov(X,,X,) =a, 
下 面 计算 Biihlmann 信和 度 估 计 的 具体 形式 。 由 无 偏方 程 (12. 3. 13) 得 到 : 
人 &, (12. 4.4) 
Dy @ =1- a/ (12. 4.5) 


ij31 


男 外 , 式 (12. 3.15) 的 nn 个 方程 变 为 : 














PN 1 n 
于 是 ， 
a(l1— 这 ao,) 3 
ca，= 一 = 一 一 
vy Lv 
将 i 从 1 到 nn 相 加 得 到 : 
人 
结合 方程 (12. 4. 5) ， 我 们 有 
要 na ao 
1 一 ao/NK = 
解 出 Ge 为 : 
~ UL 
"vtna 
从 而 得 到 : 
i Q oo a 
.二 一 -一 一 


Lv vt+na 


因此 ，X,,, 信 和 度 估 计 为 : 
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人 ~ < 也 na 了 二 
十 大， 二 十 有 =(《 人 1 一 十 Z 及 12.4.6 
oe b> Vvytna vina ( 各 六 在 ( ) 








na n 人 E[ Var(X,| ©)] 
其 中 ， vtna nik’ “OCT 











n n 
有 十 天 nt+v/a 


这 里 的 z= 





为 Bihlmann 信和 度 因 子 。 


从 式 (12.4.6) 可 以 看 出 , 在 ,关于 9 条件 独 立 同 分 布 的 假定 下 ， 
Biihlimann 信和 度 估 计 可 以 写 为 经 验 保 费 和 先 验 保费 的 信和 度 加 权 形 式 。 这 种 形 
式 从 直观 上 解释 也 是 合理 的 。 由 于 XX 的 方差 可 以 分 为 组 间 方 差 的 期 望 v 和 
各 组 方 均值 的 方差 a 两 部 分 。 若 保单 组 合 相 对 于 风险 参数 @ 来 说 具有 风险 
同 质 性 ， 这 时 (8@) = 匹 ( 届 1@) 的 波动 性 较 小 ， 也 就 是 说 各 组 间 的 均值 比 
较 接 近 而 各 组 的 经 验 数据 波动 较 大 ， 这 时 a 的 值 相对 于 w 来 说 偏 小 ，k = wv/ 
“将 偏 大 ,zx 接近 于 0， 我 们 更 加 依赖 于 先 验 估计 人 来 厘定 保费 。 当 保单 组 
合 具 有 风险 异 质 性 ， 或 w(@) =E(X|@) 的 波动 性 较 大 ， 也 就 是 说 各 组 间 
的 均值 波动 较 大 而 各 组 内 的 经 验 数据 波动 较 小 ， 即 a 的 值 相对 于 vw 来 说 较 


大 ， 则 上 的 值 较 小 ，z 将 接近 于 1， 这 时 我 们 将 主要 依赖 样本 均值 来 厘定 
保费 。 因 此 Biihlimann 信 度 估计 不 仅 继承 了 信 度 保费 的 最 小 偏差 的 优良 性 
质 ， 与 现实 比较 接近 ， 而 且 所 需要 的 参数 都 容易 根据 模型 分 布 和 先 验 分 布 
求 一 阶 矩 和 二 阶 矩 得 到 ， 所 以 它 的 应 用 非常 广泛 。 

【 例 12 -14】 承 例 12 -11 ， 假 设 某 保险 公司 承保 的 业务 中 ， 有 1/3 的 
保单 的 每 月 损失 次 数 服从 均值 为 4 的 泊 松 分 布 ， 有 2/3 的 保单 每 月 损失 次 
数 服 从 均值 为 2 的 汽 松 分 布 。 对 于 一 个 随机 抽取 的 保单 ， 已 知 同一 张 保单 
每 期 的 损失 是 独立 的 ， 观 察 到 上 个 月 的 损失 次 数 为 1。 求 这 个 月 损失 的 
Biihlmann 信 度 估计 。 

解 : 根据 题目 信息 ， 求 得 


1 2 8 
m=Elu(@)1=X4+3 XxX2=3 

1 2 8 
v=ELv(©)] = 本 和 2 

1 2 8\” 8 
a=Varlu(8)] = 训 x16+ 本 x4- [3] = 


继而 我 们 可 以 求 出 Bihlimann 信和 度 因 子 z= 上 


一 一 = 一 一 =0.25 
niv/a 1+3 0 2 


因此 ，Biihlmann 估计 值 为 (1 -z) jw.+zX=0.75 x 与 +0.25 x1=2.25 国 


我 们 在 例 12. 10 中 求 得 的 贝 叶 斯 信 度 估计 值 为 2.24， 两 者 非常 接近 。 
【 例 12 -15】 设 {多 18; j=1,…,n+1} 是 独立 同 分 布 的 泊 松 随机 变 
量 ， 参数 为 6， 而 8 服从 伽 玛 分 布 : 


Be-ie -0/8 
FTCa yy 
求 X,,, 的 Bihlmann 信和 度 估计 。 
解 : 由 于 {和 16; j=1,…,n+1| 服从 泊 松 分 布 ， 
1(0) =E(X|Q®=0) =0; v(0) =Var(X,|®=0)=0 


WE 0>0 





因此 ， 
LL=E[1(@)] =E(Q) =ag8; v=EL[»(O)| =E(Q)=ap 
a=Var[lu(®@)] = Var(©) = opB’ 





vv_oB_l 
于 是 ， k= = a 


n+tk n+1/B ”rnB+l 
XX,,1 的 Bihlmann 信 度 估计 为 : 





__mB yl 
ZzX + (lz)k= orl Tg 
与 例 12 - 13 进行 对 比 可 以 看 出 ， 在 例 12 -13 中, 当 m,=1, r=0, c= 


1 时 ， 人 情况 与 本 题 一 致 ， 贝 叶 斯 信 度 估计 值 为 : 





aB 四 


0 Nt 1% 

与 本 例 中 的 结果 是 一 致 的 。 当 Biihlmann 信和 度 估计 与 贝 叶 斯 信 度 估计 值 完全 
相等 时 ， 我 们 称 之 为 精确 信 度 。 当 贝 叶 斯 信和 度 估计 值 自身 为 经 验 数 据 的 线 
性 组 合 时 ， 则 达到 精确 信和 度 。 事 实 上 ， 当 {XX%,， j=1,-…,n| 的 条 件 分 布 和 
| es 此 时 ， 


PCz)e La(0) 1 
fel 10) = —, 00) = LA 


其 中 9 取 有 限 实 值 , jw, & 正 是 信和 度 保 费 模型 中 的 参数 。 有 兴趣 的 读者 可 自 
己 验 证 上 述 结论 。 


E(X,, |X¥) =a.B. = 











12. 4. 2 Biihlmann 一 Straub 模型 


Bihlmann 模型 假定 {X | @;j =1,- …,n} 是 独立 同 分布 的 随机 变量 ,但 
在 许多 情况 下 ， 这 个 假定 不 一 定 得 到 满足 。 例 如 ， 在 团体 保险 模型 中 ， 单 
个 被 保险 人 的 风险 水 平 在 各 年 没有 变化 ,但 团体 的 人 数 每 年 都 不 同 ， 我 们 
只 知道 此 群体 每 年 的 总 索赔 额 和 人 数 ， 此 时 ， 由 于 被 保险 人 数 的 变化 ， 该 
团体 每 年 的 人 均 索 赔 额 的 均值 虽然 相同 ， 但 是 方差 却 不 同 了 。 又 如 ， 如 果 
某 被 保险 人 某 一 年 的 索赔 次 数 数 据 记 录 的 月 份 不 全 ， 我 们 只 知道 每 年 记录 
的 总 次 数 和 记录 月 份 ， 而 不 知道 每 个 月 的 次 数 ， 也 会 导致 每 年 索赔 次 数 条 
件 独 立 同 分 布 的 假设 不 成 立 。 这 时 该 如 和 何 合计 该 国体 〈 被 保险 人 ) 的 明年 
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总 索赔 额 (次 数 ) 的 期 望 值 呢 ? 
注意 上 述 情 况 有 一 个 共同 特点 ， 虽 然 我 们 不 知道 此 群体 单位 时 间 每 人 
的 损失 数据 ,但 是 一 个 群体 或 一 段 时 间 内 的 损失 数据 的 总 值 或 均值 容易 得 
到 。 假 设 { 了 | ;j=1,… ,nj 为 群体 内 人 均 损失 或 单位 时 间 的 平均 损失 。 车 
该 群体 内 每 个 被 保险 人 的 风险 参数 9 是 相同 的 ， 则 {XX |@; j=1,…,n| 
条 件 均 值 不 变 ， 条 件 方差 改变 。 可 考虑 下 面 的 Bihlmann - Straub 模型 来 解 
决 这 类 问题 。 假 设 在 给 定 9 = 9 条件 下 ，X,,…,X, 是 相互 条 件 独立 的 ,， 具 
有 相同 的 条 件 均值 
HA(9) =E(X,|Q=0) 
但 条 件 方差 不 相同 : 
Var(X,| © =0) =v(0)/m, 
其 中 m 是 一 个 已 知 的 常数 。 在 团体 保险 中 ，m 可 以 看 做 团体 在 第 7 年 的 总 
风险 暴露 数 或 者 第 7 年 的 被 保险 人 数 。 在 给 定 @ =9 条 件 下 ,XX 可 以 看 做 第 
了 年 m 个 独立 同 分 布 被 保险 人 的 人 均 索 赔 额 。 与 Biihlmann 模型 一 样 ， 定 义 
4L=Ely(@)], v=E[v(Q@)], a= Varluy(©@)] 
由 式 (12.4.2) 和 式 (12.4.3)， 可 以 得 到 E(X,) = 人 和 Cov(X,,X) =a， 
以 及 
Var(X,) =E[Var(X,|@)] +Var[ E(X,|©)] 
=ELv(Q@)/m,] +Varlu(©)] 
=v/m,+a (12.4.7) 
下 面 计 算 X,,, 的 信和 度 估 计 。 为 方便 起 见 , 令 m= m+… + m,。 由 无 偏 
方程 式 (12.3. 13) 得 到 : 














De=1- a (12.4.8) 
j=1 
对 于 2=1,-…,n， 式 (12.3.15) 变 为 : 
a=, Qa + ai(a + mi) = by Qa + Va/ m, 
A 人 
即 2 = Lm(1- $Y a) = 2 Lm,, En (12. 4.9) 
2 Fe 2 KH 
于 是 利用 式 (12.4.8) 和 (12. 4.9) 得 到 : 
ae < 人 a oo - a oo 
在 一 一 一 pa QQ. 二 一 一 m. 二 一 -一 了 于 
K D> > v pe vk 
由 此 解 得 
人 ~ 从 v/a 
Qo = es 
1 + 2 m+v/a 
A aa ar m, 
RD Lv i m+v/a 


同样 ， 信 和 度 佑 计 可 以 写 为 : 


Gt FT aX = z+(l -2 (12.4. 10) 


i=l 


其 中 ， 


De 


m+tk’ a FY m 


事实 上 ,mm 无 可 以 看 做 团体 保险 中 团体 在 第 j 年 的 总 损失 ，m 为 n 年 内 


的 总 被 保险 人 个 数 ， 因 此 实际 上 是 这 个 团体 在 年 内 的 人 均 损 失 。 从 这 
个 意义 上 说 ， 那 么 Biihlmann - Straub 信和 度 保 费 的 形式 与 Biihlmann 模型 是 一 
样 的 。 
【 例 12 -16】 假设 被 保险 人 可 分 为 若干 个 风险 子 集 ， 每 个 风险 子 集 内 
的 每 个 被 保险 人 具有 相同 的 风险 参数 @。 被 保险 人 在 一 年 内 索赔 次 数 服从 
二 项 分 布 8(3, 8@), @ 是 随机 变量 ， 其 分 布 密度 为 mr(6) =609 (1 -6)，0 < 
9 <1。 已 知 在 1997 年 每 个 风险 子 集 有 10 个 被 保险 人 在 某 保单 组 合 中 ; 
1998 年 每 个 风险 子 集 有 12 个 被 保险 人 ，1999 年 有 每 个 风险 子 集 有 15 个 被 
保险 人 。 随 机 记录 一 个 风险 子 集 ， 它 在 这 3 年 的 总 索赔 次 数 为 18 (1997 
年 ) ，20 (1998 年 ) 和 27 (1999 年 ) 。 假 设 2000 年 该 风险 子 集 共 有 20 个 
被 保险 人 在 保单 组 合 中 ， 使 用 Bihlmann - Straub 模型 求 2000 年 该 风险 子 集 
的 总 索赔 次 数 的 信 度 估计 。 
解 : 设 WW 表示 被 保险 人 在 一 年 内 的 索赔 次 数 ， 则 
1(0) =E(W|Q=0)=30 
v(0) =Var(W|®@=0)=30(1 -09) 
又 由 @ 的 分 布 ， 可 以 计算 出 : 


x = Elu(@)] = E[38] = | 30+ ec1 -6)d6 = 


v = E[v(©)]1 = E[30(1 - @)] = ff 30(1 - 0) .60(1 ~- 0)d0 = 记 


a = Var[j(@)] = Var[3(@)] = 9Var( ©@) 
1 9 


a rf 9°60(1 ~- 0)d6 - (3 = 


m=m tm,+m;=10+12+15=37 


二 
a 3 
随机 选取 一 个 风险 子 集 ， 由 于 在 1997 年 每 个 风险 子 集 有 10 个 被 保险 
人 ， 则 该 子 集 的 人 均 索 赔 次 数 为 : 
WW 不 Wi 18 


XX i pe =10 
! 10 10” 六 


- 301 . 


" 302. 


相应 地 ,在 1998 年 和 1999 年 有 : 


20 27 
12， m, =12 4 =15， m, =15 


应 用 Biihlmann - Straub 模型 ， 信 和 度 因 子 为 : 


和 m 37 
m+k 37+4/3 


不， = 





=0.965 








过 二 > a = - 1.757 


【= 上 37 
因此 ，2000 年 该 风险 子 集 的 人 均 索 赔 次 数 的 信和 度 估 计 为 : 


z+ (1-z) j=0.965 x1.757 +0.035 x1.5 =1.748 


该 风险 子 集 的 总 索赔 次 数 的 信和 度 估 计 为 20 x1.748 =34.96。 


12.4.3 Biihlmann - Straub 模型 的 推广 


在 团体 保险 中 ，Biihlmann - Straub 模型 假定 风险 子 集 内 的 每 个 被 保险 
人 的 风险 水 平 都 是 独立 同 分 布 的 。 这 个 假定 在 保险 实际 中 并 不 一 定 满足 。 
实际 上 ， 绝 对 独立 同 质 的 风险 并 不 存在 。 当 某 群 体 中 的 所 有 个 体 并 非 完 全 
独立 时 ， 群 体 均 值 的 方差 就 会 大 于 个 体 方差 除 以 个 体 数 。 下 面 的 例子 给 出 





这 种 情况 下 Biihlmann - Straub 模型 的 推广 。 


【 例 12 -17】 设 在 给 定 @ 的 条 件 下 ，1{ 印 ,j=1,…,nj 是 相互 独立 的 
随机 变量 ,，E(|18@) =p(@)，Var(X|8) =w(@) +v(@)/m， 求 义 ,,, 的 


信和 度 估 计 。 
解 : 根据 条 件 可 知 ， 
E(X)=E[E(X|O@)] = Elu(O)] = 
Var(X,) =E[Var(X,|©)] +Var[ E(X,|©@)] 
=E[w(@) +v(©)/m] +Varlp( ©O)] 


=w +v/m;,+a 


对 于 LJ], Cov(X¥,,¥,) 二 CQ， 将 上 式 代 入 式 (12. 3 14) 得 到 : 


a = 之 wat ow tv/m) = a(l -人 ) + ow + ) EL = 1, ,n 


因此 & - a Qo/ 


口 
” w+vu/m, 


将 i 相 加 得 到 : 











Ca m, Sp 
三 Qa,=1— ao, 
i 冯 Ps 
A 1 从 
此 , a。= = 
因此 , a。 m, 1 1 +am’ 
区 re 
Kv+ wm, 信 




















< Se Pr i i pe 0 ee ed i ee i se Nr ge a Ee Gh i 1 ee op Ep 
mm 
其 中 ,mm” = > 是 
A + wm 
am, 1 
Qj = = 
v+wm,l+am 
信和 度 估 计 值 为 : 
HK a ~ m¥ 
lt+am 1+am A vt+wm, 
二 1 m, Ga 
若 令 义 = 和 二 
全 人 1 + am” 
、 Sr 7 二 人 an/w 
信 度 估计 值 等 于 zz 和 +(1 -z)。 注 意 ， 若 令 mm 趋 于 无 穷 ， 则 0 


<1， 而 在 Bihlmann - Straub 中 z 是 趋 于 1 的 。 这 说 明 无 论 风 险 暴露 数 有 多 
大 ， 信 和 度 因 子 总 小 于 1， 经 验 数 据 总 不 是 完全 可 信 的 。 | 


$12.5 经 验 贝 叶 斯 信 度 参数 估计 

在 前 面 几 节 介绍 的 信 度 模型 中 ， 都 需要 先 假设 先 验 分 布 和 条 件 分 布 已 
知 ， 然 后 得 到 参数 凡 = 巨 [已 (2|1@)],， v=E[Var(X,|@,)], 和 a=Var[lE 
(X, | @,) ] ， 进 而 得 到 信和 度 估计 值 。 然 而 在 实际 中 ， 比 如 设计 新 险种 时 ， 先 
验 信息 并 不 充足 ， 我 们 不 是 总 知道 先 验 分 布 和 损失 分 布 ， 或 者 只 能 合理 假 
设 分 布 的 形式 ， 而 不 知道 分 布 的 具体 参数 。 我 们 常常 需要 根据 具体 数据 和 
先 验 知识 进行 参数 估计 ， 这 种 方法 就 叫做 经 验 贝 叶 斯 估计 。 

根据 已 知 信息 的 多 少 ， 经 验 贝 叶 斯 估计 可 以 分 为 非 参 数 方 法 、 半 参数 
方法 和 参数 方法 。 如 果 对 7(9) 和 fi,e《(x|9) 的 分 布 形 式 均 没有 先 验 知识 的 情 
况 ， 称 为 非 参 数 情形 ; 如 果 不 知道 r(6) 的 分 布 形式 但 可 以 对 fe(x|9) 作 出 
某 种 参数 形式 分 布 的 假设 时 ， 则 属于 半 参 数 情 形 ; 如 果 对 zr(9) 和 fy。 (x 196) 
均 能 作出 具有 参数 形式 的 假设 ,需要 估计 未 知 参 数 ， 则 属于 参数 情形 。 

在 这 一 节 中 数据 将 以 如 下 形式 表示 : 对 r 宇 1 个 被 保险 人 ， 其 中 每 个 人 
的 单位 风险 损失 量 是 X, = (XX ,…,X,。) ,i=1,…,r。 随机 向 量 {X,, i =1， 
…,r| 在 统计 上 认为 是 相互 独立 的 〈 即 假设 不 同 投保 人 的 经 验 数据 相互 独 
立 )。 第 i 个 被 保险 人 的 未 知 风险 参数 是 9,,，i =1,…,r， 并 进一步 假定 0, 是 
独立 同 分 布 的 ， 具 有 结构 密度 7(9,) 的 随机 变量 @, 的 一 次 实现 (i =1,…， 
r)。 对 固定 的 i, 假设 条 件 随机 变量 X, | @, 相互 独立 ， 有 概率 密度 fi |。 (%*， 
10) ,j=1,.… ,no 

有 两 个 常见 的 情形 可 以 产生 上 述 的 数据 形式 。 第 一 种 情形 是 分 类 费 
率 厘定 。 下 标 i 表示 类 别 或 团体 , j 表示 当中 的 个 体 。 第 二 种 情形 类 似 ， 
下 标 i 仍 指 代 类 别 或 团体 ，j 表 示 年 份 ， 以 每 年 的 平均 损失 量 作 为 观察 值 。 
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例如 ，10 个 不同 风险 类 别 的 被 保险 人 ,观察 i=1, 2, 3 年 的 理赔 额 
数据 。 

经 验 数据 还 应 当 包 括 被 保险 人 i 的 风险 量 向 量 mi = (ma,…,m,,)'， 
i=1,…,r。 为 了 表达 上 的 方便 ， 记 


m, = Vm,, m = Dm 
为 被 保险 人 的 过 去 总 风险 量 。 记 
一 1 本 


为 被 保险 人 i 的 过 去 单位 风险 平均 损失 。 另 外 所 有 被 保险 人 单位 风险 平均 
损失 为 : 


1 
Sm 


…X, | 9; 是 独立 的 。 此 时 平均 风险 损失 量 有 条 件 均 值 和 条 件 方差 : 


E[X, | @, = 9.] =1( 90,), Var[ X, | 8,= 0.,] _v(0.) 





ms 
由 于 每 个 投保 人 的 风险 参数 是 同 分布 的 ， 所 以 结构 参数 可 以 记 为 =E 
[xO,)], v=E[v(Q,)],a= Varly( YO,)1]。 

在 得 到 了 风险 参数 jw， v 和 a 的 值 后 ， 我 们 可 以 计算 出 各 个 被 保险 人 的 
信和 度 因 子 Z; 和 信用 保费 。 经 验 贝 叶 斯 方法 可 以 应 用 于 Biihlmann 模型 和 
Biihlmann - Straub 模型 。 需 要 注意 的 是 ， 即 使 我 们 得 到 的 估计 值 是 结构 参 
数 的 无 偏 估计 ， 并 不 能 代表 进一步 估计 而 得 的 信和 度 因 子 和 信和 上 度 保费 就 是 无 


偏 的 。 比 如 即使 E[5] =v，E[ 4] =a， 并 不 一 定 意味 着 各 =D/& 就 是 天 = ua 
的 无 偏 估 计 。 


过.5.1 非 参数 信 计 

在 非 参 数 情形 下 ， 我们 对 7(9) 和 fi。(*|9) 的 分 布 均 无 法 作出 具有 参 
数 情形 的 假设 。 此 时 ， 为 了 估计 下 一 年 的 信 度 保费 ， 我 们 需要 利用 经 验 数 
据 ， 得 到 未 知 参数 pi、u 和 的 估计 值 六 、3 和 8， 则 被 保险 人 下 一 年 的 信 度 
保费 的 估计 值 为 : 





2 Xt+(1 -2) Ah, ne (12. 5.1) 
其 中 , 人 = 一 一， 外 = 二 
m.+k ~ 
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下 面 分 别 介 绍 非 参数 经 验 贝 叶 斯 估计 应 用 于 Biihlmann 模型 和 
Bihlmann-Straub 模型 的 情形 。 

1. Biihlmann 模型 。 在 Bihlmann 模型 中 ， 每 个 被 保险 人 的 “风险 期 间 ” 
是 相同 的 ， 即 n, = mn = …m, = 了 。 并 且 每 个 “风险 期 间 ” 的 风险 量 为 1， 即 
my =1,i=1，2,…,r,，J=1，2,…，,n。 这 可 以 理解 为 个 被 保险 人 ， 每 人 
都 有 年 的 观察 数据 ， 且 每 年 只 观察 一 

考虑 第 i 个 被 保险 人 的 平均 损失 : 





= J XX (12. 5. 2) 
所 有 被 保险 人 的 均值 为 : 

二 

人 (12. 5. 3) 
根据 条 件 期 望 和 方差 公式 : 

ELX,] = EL[LE(X,| B,)] = Elu(O.)] = (12. 5. 4) 

A A, (12. 5.5) 

EL X] =E[lX,] = (12. 5. 6) 


Var[l X,] =E[Vaor( X.| @)] +Vorl E(X,|Q,)] = +a (12.5.7) 
下 面 我 们 介绍 结构 参数 J、v 和 a 的 估计 。 对 于 从 ， 考 虑 估计 量 让 = 瑟 。 
由 式 (12. 5.3) 有 


E(X) = (rm) "DP ECX) = (mm ECE(X,|O,)) 


iwl j=l =l j=1 


因此 亡 = XX 为 4 的 一 个 无 偏 估计 。 
对 于 v， 首 先 考 虑 各 = 二 Y (XU - 元 )*。 由 于 给 定 8 = 0,，X,, j= 


站 
ee | A 





1,…,n 是 相互 独立 的 ， 因 此 给 定 8@, = 0,，% 是 wv(9,) 的 无 偏 估 计 ， 且 


E(2%.) =E[E($.|®,)] =E[v(®.,)] =v (12. 5.8) 
即 2 是 > 的 无 偏 估 计 。 于 是 统计 量 
3 = Ty ey > (和 — X,) (12. 5.9) 
也 是 wv 的 无 偏 估计 。 


接 下 来 估计 参数 a。， 由 式 (12. 5.6) 和 (12.5.7) 知 ， 际 ,， 久 ,,…，, 及 , 相 
互 独立 ， 且 有 相同 的 期 望 w 和 方差 a。+v/n。 考 虑 估计 量 
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is Ss (12. 5. 10) 


由 式 (12.5.7) 知 : 














1 a 思 
Ga) -i 
1 r i i 
SD 
5 Var[ X,] - rVar[ X] 
i 
= +e)-a (12. 5.11) 
因此 ,& = 一 -站 (XX - 久 )* -之 是 a 的 一 个 无 偏 估计 。 


式 (12.5.1) 可 以 用 单 因 素 方 差分 析 来 解释 。 事 实 上 ， 我 们 可 以 把 拥 
有 不 同 的 风险 参数 的 不 同 被 保险 人 看 做 是 方差 分 析 中 7 种 不 用 的 处 理 方式 ， 
同一 被 保险 人 的 个 损失 数据 可 以 看 做 是 对 同一 处 理 方式 的 个 观察 值 。 
那么 v 考察 的 就 是 同一 种 处 理 方式 的 不 同 数据 之 间 差 距 的 平均 水 平 。 而 a 
则 考察 不 同 处 理 方式 平均 水 平 之 间 的 差距 。 而 wv 恰恰 为 组 内 误差 ,而 & 的 
前 一 项 等 于 组 间 方 差 除 以 nn， 这 一 项 不 能 完全 反映 组 间 差 异 ， 因 为 它 包含 
了 样本 的 一 部 分 随机 性 ， 因 此 减 去 4& 中 的 后 一 项 ， 得 到 了 组 间 差 距 无 偏 估 
计 。 当 组 闻 平 方 和 相对 组 内 平方 和 而 言 比 较 小 时 一 一 也 就 是 4 相对 2 比较 
小 时 ， 接 受 所 有 处 理 方 法 有 相同 均值 的 原 假设 。 这 也 意味 着 2 接近 于 0， 


即 给 予 每 个 半 , 很 小 的 信 度 ， 这 在 所 有 被 保险 人 风险 同 质 的 情形 下 是 一 个 很 
自然 的 结论 。 

由 于 估计 和 值 中 存在 减 号 ， 因 此 可 能 会 出 现 4<0 的 情况 ， 这 代表 了 组 间 
差距 非常 小 ， 此 时 我 们 令 2=0。 这 种 情形 等 价 于 在 方差 分 析 中 统计 量 小 
于 1， 此 时 我 们 无 法 拒绝 均值 相等 的 原 假 设 。 

【 例 12 -18】 假设 有 两 个 被 保险 人 ， 他 们 过 去 三 年 的 损失 额 数据 如 表 
12 -2 所 示 。 











表 12 -2 
ER 保单 年 度 
| | | : => 
1 4 8 9 


| 


(1) 估计 两 个 被 保险 人 在 下 一 年 的 Bihlmann 信和 度 估 计 ; 
(2) 如 果 第 二 个 被 保险 人 的 经 验 数据 改 为 这 = (5,，6，10)， 分别 估计 


两 位 被 保险 人 下 一 年 的 信和 度 估计 。 

解 : (1) 由 表 12-2 知 ,， 先 r=2, n=n,=n=3, mj=1, m=m,=3, 
此 数据 适合 应 用 Bihlmann 模型 。 

根据 数据 ， 可 以 求 出 : 














和 
3 3 2 
根据 式 (12. 5.9) 和 和 式 〈12. 5. 10) ， 分 别 求 出 : 
| 5 ey 
Dn 
ee ee 学 2 EE a 朗 
= F347) + (8 7) + (9 -7) + (1 -11) 
2 2 11 
+(13 -11)*+(9-11)"?] = 六 
A 1 : 二 _Y 2 了 
区 人 Se n 
- 工 _oy? _91 11 -13 
= 工 x[(7-9) +(lLI-9)7] -村 = 忆 
进而 ， 
~ 了 11/2 mi 3 
1 = 二 = 一 人 -1.27， 之 = -= 一 一 =-0.71=2 
a 13/3 2 m, +k 3+1.27 2 
两 位 被 保险 人 下 一 年 的 信 度 保费 估计 分 别 为 : 
ZY +(1 -2) RL=0.71x7+(1-0.71) x9 =7.59 
2, ,+ (1 -2) KB=0.71 x1ll+(1-0.71) x9 =10.41 
(2) 此 时 ， 时 ,= 7，X，= 7， 以 及 X= 人 =7 = 的。 





根据 式 (12. 5.9) 和 式 (12. 5. 10) ， 分 别 求 出 : 
人 1 - = vy 2 
i 





2x2 
+(6-7)*+(10-7)’] =7 
A 1 = 了 vy 
= 人 世人 
的 oe . 2 n 
eo A 
= 了 XL(7 7) ”+(7 -7)] 3 


出 现 &<0 的 情况 ， 此 时 采用 之 =0。 所 以 两 位 被 保险 人 在 下 一 年 的 信 度 保 


费 估 计 值 均 为 及 =7。 站 
2. Biihlmann - Straub 模型 。 该 模型 考虑 了 不 同 投 保 团 体 中 个 体 数 或 者 
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精算 模型 


观测 年 数 不 同 的 情况 ， 因 此 数据 背景 与 本 节 开 始 介绍 的 是 一 致 的 : 对 于 > 
个 投保 团体 ， 其 中 第 i 个 被 保险 人 (i=1,2,…,r) 的 “风险 期 间 ” 数 为 mm， 
其 中 第 i 个 团体 的 第 j 个 “风险 期 间 ” 有 mj 个 风险 量 ,， 单位 风险 损失 量 为 
X;。 其 中 单位 风险 损失 量 X, 是 随机 变量 ,第 i 个 被 保险 人 的 单位 风险 损失 


量 记 为 闷 = (X。，X。，…X,,) ， 不 同 被 保险 人 之 间 的 单位 风险 损失 量 是 独立 


E[X,] = E[LE(X;|@,)] = Elnx(O.)] = 人 
v(©.,) 





Var[ X, | ©,] = 


Var[ X;] = Var[ E(X;|©,)] +E[Var(X,|©,)] =a + 


由 于 着, ，。，… 了 关于 ©@, 的 条 件 独立 ， 则 


E[X.| ©.] = 二 六 m,ELX, | ©,] = (QQ) ,EL[X] =pu (12.5.12) 





i 1 n, 1 Ri 
Var[ X,|®@,] = i Vert) @,] = Gs) 
Var[ FX,] =E[Var( X,| ©@)] +VarlE(X,| OQ,)] = + 

可 下 < 
E[X¥] Se miE[ X,] 二 信 

由 于 针 ,，X,,…,X, 是 独立 的 ， 所 以 ， 
过 mx 

去 2 多 1 

Var[ X] = 7 2 mi Var[ X,] 二 7 a 


下 面 我 们 给 出 结构 参数 1，v 和 a 的 估计 。 
根据 式 (12. 5. 12) , 4 的 一 个 无 偏 估计 是 应 = 王 。 若 记 


> ms (CX, ee X,)? 
pe 


n,—1 


B{ DY, ml (Xs - ¥.)°]| 


nm-1 
ly rmxy 
Sy Ltp- X) ]} 


1 
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= eB mL Kp) +2 pp Ki) + Cp 1) 
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< 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 











= 
1 之 一 
二 yy my[ Var( X;) - Var( X.)] 
i 
en he se (12. 5. 15) 


因此 ，v,;，i=1,…,r 都 是 wv 的 无 偏 佑 计 。 这 些 无 偏 估计 量 的 任意 加 权 平 均 也 
是 v 的 无 偏 估计 。 我 们 选择 权重 与 n, -1 成 比例 ， 就 是 让 原始 的 XX 的 权重 与 


mm 成 比例 ， 即 取 w; = (mm A (n, -1), 可 以 得 到 v 的 一 个 无 偏 估计 量 : 


> > ms (XX, 一 XSy? 


入 i=! /=1 


$ = (12. 5. 16) 


> (n,—1) 


下 面 估计 <， 根据 式 (12. 5.13) 考虑 估计 量 : 





d= [Fm -Tr /mm Pm) (12. 5. 17) 
由 于 


E[ Fm(X, - X)"] 
= E[ Sm(X, ~-p)"]- Elm — xX)’] 


= 5 mVar[ X,] 一 mVar[ X] 


i=1 


一 人 + a] m( 这 十 m Bm?a) 


一 a 记 


带 和 人 式 (12. 5.17) ， 得 到 : 
FE[a] = {EL Dm(X, KY] -Cr 1) EI/(m- mT m) 


= (mm Tm)a/(m- mm)= a (12. 5. 18) 


因此 可 见 , 4 = [FmlX, -XX) -ar-1)]x(m - mm“ 并 到) 为 a 的 一 个 无 
偏 估计 。 | 

与 在 Bihlmann 模型 中 相似 的 ， 可 能 会 出 现 4 <0 的 情况 ， 此 时 经 验 数 
据 表 明 不 同 的 被 保险 人 之 间 损 失 情 况 的 差距 很 小 ， 先 验 知识 值 得 相信 ， 取 


~ 


Z=0。 
值得 注意 的 是 ， 昌 然 所 有 参数 的 估计 值 都 是 无 偏 的 ， 但 这 并 不 一 定 就 
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说 明 经 验 信 度 估计 值 也 是 无 偏 的 。 事 实 上 我 们 可 以 求 出 所 有 被 保险 人 的 总 
损失 7L = 对 m 元 。 依 照 上 述 模型 ， 如 果 在 过 去 也 按照 上 面 计算 出 的 信 度 
保费 收取 保费 ， 总 保费 应 该 是 ， 


TP = 5 ml[Z.X, + (1 -2,)A] 


se 


i=1 i 


> mL Cl 2 ) A (1 2 
2 > mk 


m,+k 


r 
1 
人 ~ 
入 





(了 X, 一 几 ) 


理想 情况 是 到 等 于 TP。 因 为 任何 增加 保费 的 行为 要 想得到 监管 机 构 的 
同意 ， 必 须要 以 过 去 总 的 索赔 水 平 为 依据 。 信 和 度 保 费 需 要 有 着 理论 和 现实 意 
义 ， 同 时 如 果 还 能 够 保持 总 保费 收 和 人 与 总 损失 相 匹 配 就 更 好 了 。 这 应 该 有 


mk 





(Xi -FA) =0 


和 ~ 


1 m,+k 





k= Se (12. 5. 19) 
5 之 . 

式 (12.5.19) 的 人 的 估计 是 个 体 样 本 均值 的 信和 度 加 权 平 均 ， 而 非 直接 
按 风 险 量 的 加 权 平 均 。 它 的 好 处 在 于 估计 先 验 均值 时 考虑 到 了 每 个 个 体 样 
本 的 可 信和 度 ， 合 得 总 保费 等 于 总 损失 。 

【 例 12 -19】 假设 两 组 被 保险 人 在 过 去 三 年 的 经 验 数据 和 第 四 年 的 被 
保险 人 数 如 表 12 -3 所 示 。 

求 : (1) 对 两 组 被 保险 人 第 四 年 应 收取 的 信和 度 保 费 。 

(2) 使 用 信和 度 加 权 平 均 估 计 人 ， 两 组 被 保险 人 各 自 应 缴纳 的 第 四 年 的 
信 度 保费 。 

(3) 如 果 第 一 组 保险 人 的 第 二 年 总 损失 数据 不 是 18 000 而 是 15 000 ， 
重新 计算 上 面 问题 。 


























表 12-3 
保单 年 度 
被 保险 人 1 | 2 3 4 
总 损失 一 | 11000 18 000 一 
团体 人 数 EE | 50 80 70 
总 损失 20 000 | 25 000 24 000 三 
团体 人 数 











解 : 

(1) 根据 数据 ， 可 以 看 出 r=2，m =2，n, =3。 对 于 第 一 组 被 保险 人 
团体 ,下 标 表 示 哪 一 年 对 运算 没有 有 影响。 方便 起 见 ， 我 们 下 标 采 取 的 年 份 
和 表 中 对 应 : 

mu =50, X,, = 11 000/50 =220, ms =80， XX, =18 000/80 =225， 以 及 


=m, +ms =130, X,= (11 000+18 000) /130 =223.08。 
对 于 第 二 组 被 保险 团体 ，m,, = 100，X, =20 000/100 =200，m,, = 120， 
X,, =25 000/120 =625/3, m,, =125, X,, =24 000/125 =192, m, = m,, + m,, 


_ 20 000 +25 000 +24 000 
345 证 


mi 





+ma=345,， m=m,+m,=475， 以 及 XX， 200 


~ = 223.08 x130 +200 x345 
X > 二 
于 是 , 130 + 345 2 


根据 式 (12. 5. 16) 和 式 (12. 5. 17)， 
> > m,; (X, 一 大) 


人 i=] 


rR 








= [50 x (200 -223.28)2+.… +125 x (192 -200)’] 


=5 700. 855 


Q> 


二 一 m: 

= [DmxX, — XX) -Dr-— DA 四 | 
m 

_ 130 x (223. 08 — 206. 31)” +345 x (200 —206. 31)’ ~5 700. 855 x 1 
475 — (130’ + 345° ) /475 











=0.84, 2,=——— =0.93 
m+k m, 十 天 


被 保险 人 团体 1 和 被 保险 人 团体 2 的 个 体 平 均 信 和 度 保 费 估 计 值 分 别 为 : 
仿 下 ,+(1- 仿 ) 站 =0.84x223.08 +(1 -0.84) x206.31 =220. 45 


过 和 ,+(I- 仿 ) 站 =0.93x200+(1-0.93) x206.31 =200.41 
于 是 ， 两 个 被 保险 人 团体 下 一 年 要 缴纳 的 总 的 信 度 保费 估计 分 别 为 220. 45 
x70 =15 431.5 和 200. 41 x100 =20 041。 
(2) 从 上 题 中 我 们 知道 2 = 0.84，2, = 0.93, 根据 式 (12. 5. 19)， 
得 到 : 


ZX 
2 " ”0.84 x223.08 +0.93 x 200 


全 和 0. 84 +0.93 
ZZ 


= 210. 95 





i=1 


于 是 两 个 被 保险 团体 的 个 体 平均 信和 度 保 费 估计 值 分 别 为 : 
ZK, +(1-2)f=0.84 x223.08 +(1-0.84) x210.95 =221. 18 


2 ,+(1 2) =0.93x200 + (1 -0.93) x206.31 =200.72 
于 是 ， 两 个 被 保险 团体 下 一 年 要 交 的 总 的 信和 度 保 费 估计 分 别 为 221. 18 x70 
=15 482. 6 和 200.72 x100 =20 072。 


(3) 此 时 ,XX,,=15 000/80 =187.5， 久 ,= (11 000 +15 000) /130 = 
200 ， 其 他 不 变 ， 经 计算 可 得 凤 =200， v=16 888. 57， 


和 


i=] 
_ 130 x (200 ~ 200)’ +345 x (200 ~ 200)’ -16 888.57 x1 
475 — (130’? + 345’ )/475 





= 一 89. 43 
此 时 &<0， 因 此 取 2, =2, =0， 两 个 团体 中 的 个 体 平 均 保费 估计 均等 于 所 = 
200。 两 个 被 保险 团体 总 的 信和 度 保费 估计 值 分 别 为 14 000 和 200 000。 国 


12. 5.2 半 参 数 估计 

在 某 些 情况 下 ， 我 们 不 能 准确 的 得 到 风险 参数 @ 的 参数 分 布 形式 ， 但 
是 可 以 知道 当 给 定 @ =9 时 义 的 条 件 分 布 的 参数 形式 ,并且 有 理由 确认 此 . 
条 件 分 布 是 合理 的 。 这 时 可 应 用 半 参 数 估计 方法 。 首 先 根据 天 | @ 的 分 布 函 
数 得 到 ww(@) =E[X|8@] 与 v(9) =yVyor[X|1@] 之 间 的 关系 ， 然 后 利用 
yar[X] =v+a 求 出 结 作 参数 ww，vwv 和 a 的 估计 值 ， 最 后 求 出 信和 度 估 计 。 下 
面 看 一 个 例子 。 

【 例 12 -20】 假设 某 年 机 动车 辆 险 索赔 次 数 分 布 如 表 12 -4 所 示 。 


表 12 -4 


被 保险 人 数 211 25 5 3 1 489 


基于 这 个 数据 计算 每 个 被 保险 人 下 一 年 索赔 次 数 的 信 度 估计 。 假 设 索 
赔 次 数 服 从 条 件 泊 松 分 布 。 已 知 代表 一 个 被 保险 人 一 年 内 的 索赔 次 数 ， 
了 服从 均值 为 @8 的 泊 松 分 布 。 经 验 数据 符合 Bihlmann 模型 的 模式 ， 即 对 于 
r 个 被 保险 人 ， 每 人 都 有 pn 年 的 观察 数据 ， 且 每 年 只 观察 一 次 ， 同 一 个 被 保 
险 人 的 数据 关于 风险 参数 都 是 条 件 独立 同 分 布 的 。 第 i 个 被 保险 人 在 第 j 年 
的 索赔 次 数 为 X,。 现 在 要 估计 第 i 个 被 保险 人 在 下 一 年 的 信和 度 估 计 久 ,,,,。 

解 : 这 是 一 个 Bihlmann 模型 ， 有 1 489 个 被 保险 人 ,每 人 有 n=1， 风 








险 量 m, =1。 对 第 i 个 投保 人 (i=1,-…,1 489) 假设 X, | 9,=9, 服 从 均值 为 
9; 的 泊 松 分 布 。 据 泊 松 分 布 的 性 质 ， 有 
Q=E[X|Q] =/(@) =Var[ X|@] =v(O) 
也 就 是 说 ， 
Lk=Eljk(@)]=Elv(@)] =v 
类 似 于 非 参 数 情 形 ， 采 用 


1 489 


1 1 
X = T4852 Ya) = T4800 * 1 245 +1 x21l +3 x25+4x3) = 0.1934 


并 且 对 于 任何 分 布 ， 均 有 
Var[ X,] =E[Var(X, |@)] +Var[ E(X,|@)] =v+a= 人 +a 
因此 v +a 的 一 个 无 偏 估计 是 样本 方差 
> WE 1 
1 488 1 488 
= 0. 234 





[1 245 x (0 — 0.1934)’ +:……+2 x (4 -0.1934)’] 


故 有 .6 =0.234 -0. 1934 = 0. 040 和 =0.1934/0.040 =4.76， 信 和 度 因 子 
2=1I/ (1+4.76) =0.17。 于 是 被 保险 人 索赔 次 数 的 信 度 估计 值 是 0. 17X, 
+0.83 (0.193) 其 中 工 , 根 据 不 同 投保 人 取 值 为 0，1，2，3，4。 加 


12.5.3 参数 估计 : 

当 我 们 既 可 以 假设 给 定 @ = 9 时 的 条 件 分 布 的 参数 形式 ， 并 且 有 理 
由 确认 假设 合理 时 ， 应 该 使 用 参数 估计 方法 。 这 时 ， 我 们 可 以 采用 统计 上 
的 方法 进行 处 理 ， 极 大 似 然 估计 是 最 常用 的 方法 。 

对 于 经 验 数据 天 = (XX, ,，,… ,人 X,) 和 风险 参数 9,, 假设 已， | @,, X, | 
8B,,… ,Xu | @, 独立 同 分 布 ， 并 且 已 知 其 密度 函数 fi |。 (zx |16)，i=1，2， 
Ty J=1， 人 23 以 及 @9，,， 8@,,…,@, 独立 同 分布 ， 密度 薄 数 为 7(9,)， 
i=1, PRY 我 们 可 以 写 出 及 ,= (下 Sy) 的 联合 密度 站 数 : 


友 ( 兹 ) = | [JI foals 10) 10) de (12. 5. 20) 
由 于 不 同 被 保险 人 之 间 的 损失 是 独立 的 ， 我 们 可 以 写 出 似 然 函数 : 

£5 = TIA) 
以 及 对 数 似 然 函数 ， 


r 


l= lnL = 》 lnfi(z,) 


i=l 


极 大 似 然 方法 就 是 通过 最 大 化 L 或 1 得 到 结构 参数 的 估计 值 。 下 面 通 过 
一 个 例子 进行 介绍 。 


313， 


精算 模型 


“314. 


【 例 12 -21】 已 知 经 验 数据 符合 Bihlimann 模型 的 模式 ， 即 n, =n, =… 
n,=n, 且 my=1, i=1, 2,…,r, j=1, 2,-…,n。 并 是 假设 X,|9,~N (9,， 
v), 以 及 ,~N (1k, a), 即 


foe (m10) = Qn) xonp| -20(m 0)"], ~ <% < 


7 (0.) = (25a) ?x exp| - 支 (e -4)]， 一 oo <Xi < oo 


求 参 数 ，v 和 va 的 极 大 似 然 估 计 。 
解 : 根据 式 (12. 5. 20) ， 求 出 


fi (X,) , [I fol! 90,) J (0.)do. 


= |{1 {(27rz) 2 x exp| -去 (ms 区 0.)"| | }x (ZH) 


x exp| 去 (8 - 1) |a0. 
化 简 、 并 忽略 那些 不 含 4，v 和 a 的 项 
太吉 ) va | exp[- 走 台 (0) -去 (90. -四 和 48 
(12. 5.21) 


此 时 车 直接 计算 ， 运算 量 较 大 ， 我 们 考虑 互 , 的 密度 函数 ， 根 据 式 
(12. 5. 20) ， 可 以 求 出 


f(z,) 过 [7 | 0.) m7( 0,)d0, 
e， 
= | (4mav/n) exp[ -王公 -6 -元 (9 -Ai]ae， 
现在 比较 /( 名 ) 与 扎 亏 ) ， 由 于 


2 (zy — 0.)” = 2 (xy — % t Xi -0.)” 二 2 (xy -£1) + nz -0.)” 
所 以 ， 


(vx oxp[ -HE (mm -5) A) (12. 5.22) 
进而 ， 
5 = [ACS) vt xexp[- 寺 站 (二 人 区 a) 


接 下 来 求 /()。 由 于 X,|8,~N (@,, v), 可 得 XX,|@,~N (9@,, 
v/n); 又 由 于 @, ~N (jx，a)， 可 以 求 出 ,~N (a+v/n)， 即 


f (元 ) =(27rco ) “exp| -2 (zp) | ， 其 中 m =a+z 


也 就 是 说 ， 


Lo yi TR Xe | 于 1 a 
也 人 xp 六 


ii 7 


_ 2 1 < a 2 
(xy 一 元) | 


现在 估计 从， v 和 ww: 
LoL (v) ZL (4, w), BLl=L +L, 
其 中 ， 

















i = lnL(v) 中 bai 于 区 之 《xi — Zz.)” 
1 2 
1 = lnb(p,w) =- i (元 ~ J) 
对 ! 求 偏 导 ， 得 : 
a lS (i 
a 去 > (z 1) 
al -rr(n—-1)l1 1 ee 
Ov 2 vy ee 交 《xi — Xx,) 
al rl1 Li 2 
dawmw 2 pr 区 
为 最 大 化 !， 令 上 述 偏 导 为 零 ， 得 到 估计 值 : 
DR > > xs 一 元 ) (元 一己) 
人 = X, $= 2 —1) A r 


根据 w =a +v/n 求 出 : 


r 


> 《元 一 下 ) 2 之 《xj 一 元 ) 


~ =】 


aG=0-v/n = - 





r ml(n—-1) 
这 岂 个 估计 和 值 似 曾 相 识 ， 本 例 中 得 到 的 及 和 vv 与 在 Bihlmann 模型 的 非 
参数 估计 中 得 到 的 估计 值 一 致 ， 而 & 的 差异 也 只 在 第 一 项 的 分 母 。 


习题 


SS SE 


1. 完全 可 信条 件 要 求 廊 在 0.05E( 钱 ) 范围 内 波动 的 概率 为 0.9， 现 在 


有 新 的 标准 ， 要 求 了 在 kE( 陡 ) 范围 内 波动 的 概率 为 0.95 。 求 出 的 值 使 
这 两 种 标准 得 到 的 风险 数 不 变 。 
2. 基于 样本 数 n=100 的 部 分 可 信 因 子 z=0.4， 至 少 需 要 增加 多 少 样 本 
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数 使 z 增加 到 0.53? 

3. 每 一 时 期 的 总 理赔 额 8 服从 复合 泊 松 分 布 ， 理 赔 强度 的 密度 函数 为 
了 f(y) =5y“, y>1。 样 本 数 的 完全 可 信 标 准 要 求 S 在 0.05E(S) 范围 内 波 
动 的 概率 为 0.9 。 如 果 相 同 的 风险 数 运 用 的 频数 变量 和 NN， 则 每 一 个 风险 期 
的 理赔 次 数 在 100r%E(N) 内 波动 的 概率 为 0.9$， 试 确定 r 的 值 。 


4. 理赔 次 数 的 概率 分 布 函 数 为 P(z) = [jg (1-9)" ，x=0，1，， 


m， 理 赔 次 数 在 0.01E( 了 ) 范围 内 波动 的 概率 为 0.95， 其 中 完 会 可 信条 件 
下 ,FE( 时 ) 为 34S74， 求 go。 
5. 设 蒜 表示 理赔 额 ， 服从 均值 为 5 的 指数 分 布 ,假定 r=0.05, p= 


0.9， 求 理赔 额 期 望 舍 计 值 着 的 完全 可 信条 件 。 

6. 假设 个 体 风险 的 索赔 次 数 服从 泊 松 分 布 ， 每 次 索赔 额 的 变异 系数 为 
2,，Qa=0.1, rr = 0.05 ， 当 个 体 风 险 的 经 验 总 索赔 次 数 为 多 少时 ， 用 样本 赔 
付 额 数据 估计 索赔 强度 的 可 信 度 为 100% ? 

7. 假设 一 年 内 的 理赔 次 数 服 从 均值 为 8 的 泊 松 分 布 ， 其 先 验 密度 为 


e 


7T(0) 二 0<0<k， 每 年 索索 赔 的 非 条 件 概 认为 0.575， 试 确定 


的 值 。 
8. 在 一 个 保单 组 合 中 ， 每 一 个 被 保险 人 每 年 最 多 只 发 生 一 次 理赔 ， 其 


二 
0.07? 
保险 人 在 第 一 年 理赔 一 次 ， 在 第 二 年 无 理赔 ， 对 于 该 被 保险 人 ， 试 确定 其 
后 验 概 率 。 

9. 对 于 某 一 特定 风险 ， 一 年 之 内 的 理赔 次 数 服 从 均值 为 pp 的 伯 努 利 分 
布 ,pp 的 先 验 概 率 分 布 为 [0，1] 上 的 均匀 分 布 ， 计 算得 到 的 贝 叶 斯 信 度 
估计 值 是 观察 理赔 额 的 17S 时 ， 则 理赔 人 额 为 0 的 年 数 是 多 少 ? 

10. 一 个 保单 组 合 有 100 个 独立 的 个 体 ， 其 中 25 个 个 体 的 理赔 限额 为 
5 000，25 个 的 理赔 限额 为 10 000，50 个 的 理赔 限额 为 20 000。 在 分 类 以 前 ， 
这 些 风 险 个 体 拥 有 相同 的 理赔 额 分 布 ， 即 服从 参数 分 别 是 96=5 000，au=2 的 
帕 累 托 分 布 ， 在 分 类 以 后 ， 根 据 理赔 报告 可 以 显示 出 每 一 个 范围 的 风险 数 ， 


发 生 概 认为 9g， 先 验 密度 为 7(g) = 0.6<g<0.8，, 一 个 随机 抽取 的 被 


-但 是 区 分 不 开 每 一 次 理赔 的 理赔 限额 。 这 个 报告 准确 显示 了 一 个 随机 选择 的 


理赔 ， 位 于 9 000 ~11 000 范围 内 ， 试 确定 该 个 体 属 于 理赔 限额 为 10 000 的 概 
率 。 

11. 两 个 盒子 每 个 里 面 都 装 了 形状 相同 的 10 个 球 。 第 一 个 盒子 里 面 有 5 
个 红 球 和 5 个 白 球 ， 第 二 个 金子 里 面 有 2 个 红 球 和 8 个 白 球 ， 每 个 球 被 抽 中 
的 概率 是 相等 的 。 现 随机 抽 选 一 个 金子 ， 两 个 金子 等 概率 被 抽 中 ; 从 这 个 金 
子 中 随机 选 出 一 个 球 ， 放 回 原 盒子 后 再 从 该 金子 中 随机 选 出 一 个 球 。 假 设 第 


一 个 被 抽 中 的 球 是 红色 的 ， 那 么 第 二 个 被 抽 中 的 球 也 是 红色 的 概率 是 多 少 ? 

12. 在 观察 到 任何 理赔 以 前 ， 你 认为 理赔 额 的 大 小 服从 参数 为 8 = 
10，aw=1，2 或 者 3 的 帕 累 托 分 布 ， 三 种 情况 等 概率 。 现 在 观察 到 一 个 随 
机 抽取 的 样本 理赔 额 为 20 ， 试 确定 该 样本 点 下 次 理赔 额 大 于 30 的 后 验 
概率 。 

13. 一 个 完全 独立 个 体 的 凤 险 集 可 分 为 两 类 ， 每 一 类 拥有 相同 的 样本 
数 。 在 类 别 1 中 ， 每 一 年 的 理赔 数 服 从 均值 为 5 的 泊 松 分 布 ; 在 类 别 2 中 ， 
每 一 年 的 理赔 数 服 从 参数 为 肥 =8，9=0.55 的 二 项 分 布 。 一 个 随机 选择 的 
风险 个 体 在 第 一 年 有 3 次 理赔 ， 在 第 二 年 有 次 理赔 ， 在 第 三 年 有 4 次 理 
赔 。Buhlmann 信 度 估计 在 第 四 年 的 理赔 数 为 4.6019。 求 ro 

14. 某 保险 公司 售 出 一 个 保单 组 合 ， 过 去 的 经 验 显 示 平 均 的 理赔 频率 
为 0.425 ， 期 望 值 的 方差 为 0.37,， 方差 的 均值 为 1.793。 现 在 从 保单 组 合 中 
随机 选择 一 种 被 保险 人 ， 该 种 类 别 的 被 保险 人 中 再 选 出 9 个 个 体 ， 一 共有 7 
次 理赔 。 现 在 从 这 种 类 别 中 再 选 出 5 个 个 体 ， 求 出 这 5 个 个 体 总 理赔 数 的 
Buhlmann 信 度 估计 。 

15. 已 知 两 个 风险 A 和 B 的 损失 金额 服从 表 12 -5 所 示 的 分 布 。 

其 中 风险 A 发 生 损 失 的 概率 表 12-5 
是 风险 B 的 两 们 。 如 果 已 知 某 个 
风险 在 某 次 事故 中 的 损失 额 为 


损失 额 | 风险 4 的 概率 分 布 | 风险 中 的 概率 分 布 











300 0.5 0.6 
300, 求 该 风险 下 次 损失 额 的 3 000 0.3 0:3 
Buhlmann 信 度 估计 。 70 000 0.2 0.1 








16. 考虑 一 个 由 团体 保单 形 
成 的 保单 组 合 。 对 整个 保单 组 合 而 言 ， 平 均 每 个 被 保险 人 的 期 望 纯 保费 为 
2 400。 对 于 不 同 的 团体 保单 ， 平 均 每 个 被 保险 人 的 纯 保 费 是 不 同 的 ， 不 同 
假设 均值 之 间 的 方差 为 500 000 。 对 于 同一 个 团体 保单 ， 不 同 被 保险 人 的 纯 
保费 也 存在 差异 (用 组 内 方差 表示 )， 所 有 团体 保单 的 过 程 方差 的 均值 为 
250 000 000。 假 设 一 份 团体 保单 上 年 的 索赔 经 验 如 下 : 被 保险 人 数 为 240 
人 ， 平 均 每 个 被 保险 人 的 经 验 纯 保费 为 3 000。 计 算 该 团体 保单 下 每 个 被 保 
险 人 的 信和 度 纯 保费 。 

17. 假设 风险 集合 中 只 有 两 个 规模 相等 的 个 体 风险 ， 对 每 个 风险 的 观 
察 期 均 为 3 年 ， 第 一 个 风险 的 经 验 损 失 为 : 3，5，7; 第 二 个 风险 的 经 验 损 
失 为 : 6，12，9 。 计 算 这 两 个 风险 的 Biihlmann 信和 度 保费 。 

18. 理赔 次 数 服 从 均值 为 m 的 泊 松 分 布 ， 理 赔 额 服从 均值 为 20m 方差 
m’e™” 
2 

理赔 额 和 理赔 次 数 的 分 布 是 独立 的 。 确 定 总 理 配 额 组 内 方差 的 期 望 。 

19. 在 大 量 的 商业 被 保险 人 中 你 得 到 了 如 下 数据 : 每 个 被 保险 人 的 损 





为 400m”。m 的 密度 涵 数 为 1/ (m) = ，0<m<%，, 其 中 对 于 任何 m， 
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失 是 独立 的 ， 并 且 拥 有 相同 的 均值 和 方差 ， 均 值 为 25， 假设 期 望 的 方差 为 
50， 条 件 方 差 的 期 望 为 10 000。 现 随机 选择 一 个 被 保险 人 得 到 表 12 -6 所 
列 经 验 数 据 。 试 确定 每 个 被 保险 人 的 Bihlmann - Straub 保费 。 


表 12 -6 




















20. 一 年 度 两 类 风险 的 累计 损失 分 布 图 表 12 -7 所 示 。 随 机 选择 一 个 风 
险 个 案 ， 观 察 到 在 前 两 个 年 度 的 损失 都 为 0 。 确 定 该 个 案 在 第 三 年 度 的 中 
叶 斯 信 度 估计 值 。 











表 12 -7 
ee 累计 损失 
四 | 0 50 1 000 
A 0.8 0.16 0. 04 





21. 在 第 20 题 的 条 件 下 ， 确 定 该 个 案 在 第 三 年 度 的 Bihlmann 信 度 
保费 。 

22. 一 个 保险 公司 有 两 组 投保 单 。 在 头 四 个 保单 年 度 总 理赔 额 如 表 
12 -8 所 示 (单位 为 百 万 元 )。 假 设 这 两 组 保单 有 相同 数目 的 被 保险 人 ， 根 
据 Bihlmann 模型 计算 每 一 组 在 第 五 年 的 经 验 贝 叶 斯 信 度 保费 。 

















23. 一 个 保险 公司 有 两 组 保单 ， 头 三 年 的 累计 理赔 额 如 表 12 -9 所 示 ， 
假设 这 两 组 拥有 相同 的 被 保险 人 数 。 求 第 一 组 保单 在 第 四 年 的 Bihlmann 信 
度 保费 。 

















24. 在 第 23 题 的 条 件 下 ， 利 用 个 体 样 本 的 信 度 加 权 平 均 计算 凡 ， 找 出 
第 一 组 保单 在 第 四 年 的 Biihlmann 信和 度 保费 。 

25. 在 第 23 题 的 条 件 下 假设 第 二 组 保单 在 保单 年 度 1、2、3 的 累积 总 
理赔 为 2、8、14， 计 算 第 一 组 保单 在 第 四 年 的 Biihlmann 信和 度 保费 。 
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第 十 三 章 随机 模拟 


学 习 目 标 。 

了 解 均匀 分 布 随机 数 产 生 的 原理 

熟悉 一 般 分 布 和 正 态 随机 向 量 的 随机 数 产 生 方 法 ， 掌 握 泊 松 分 布 、 

正 态 分 布 随机 数 产 生 方 法 

口 了 解 Bootstrap 方法 的 基本 原理 ， 熟 悉 使 用 Bootstrap 方法 计算 均 方 
误差 

口 了解 MCMC 模拟 的 基本 原理 

口 熟练 运用 随机 模拟 方法 解决 精算 中 的 实际 问题 




















I 


客观 世界 的 某 些 现象 之 间 存 在 着 某 种 相似 性 ， 因 而 可 以 从 一 种 现象 出 
发 研究 另 一 种 现象 。 比 如 在 分 析 一 个 系统 时 ， 可 先 构 造 一 个 与 该 系统 相似 
的 模型 ， 通 过 在 模型 上 进行 试验 来 研究 原 系统 ， 这 就 是 模拟 (Simulation ) 。 
随机 系统 可 以 用 概率 模型 来 描述 并 进行 试验 ， 称 为 随机 模拟 方法 ， 又 称 蒙 
特 卡 罗 (Monte Carlo) 方法 或 统计 试验 法 。 

随机 模拟 在 保险 精算 中 的 用 途 非 常 广泛 ， 既 可 用 于 确定 性 问题 ， 又 可 
用 于 随机 问题 的 处 理 。 当 某 一 问题 用 传统 的 方法 处 理 有 较 大 难度 或 计算 过 
于 繁杂 时 ， 就 可 以 采用 随机 模拟 方法 。 例 如 在 分 析 保 险 公 司 的 资产 与 负债 
配 比 策略 、 聚 合理 赔 风 险 等 问题 时 ， 都 可 用 到 随机 模拟 方法 。 一 般 地 说 ， 
在 以 下 几 种 情况 下 ， 随 机 模拟 方法 将 发 挥 其 独特 作用 : 


1. 无 论 从 费用 还 是 从 时 间 上 均 难 以 对 风险 系统 进行 大 量 实 测 ; 
2. 由 于 实际 风险 系统 的 损失 后 果 严 重 而 不 能 进行 实测 ; 

3. 难以 对 复杂 的 风险 系统 构造 精确 的 解析 模型 ; 

4. 用 解析 模型 不 易 求解 ; 

5. 对 解析 模型 进行 验证 。 


随机 模拟 的 基本 步骤 是 : (1) 建立 恰当 模型 ; (2) 设计 试验 方法 ; 
(3) 从 一 个 或 多 个 概率 分 布 中 重复 生成 随机 数 ; (4) 分 析 模 拟 结 果 。 在 这 
四 个 基本 模拟 步骤 中 ，(1)、(2) 和 (4) 与 所 研究 的 特定 问题 相关 性 很 
强 , 而 (3) 随机 数 的 生成 则 是 任何 模拟 的 基本 要 素 。 因 此 ， 本 章 将 讨论 几 
种 常用 分 布 的 随机 数 生成 方法 ， 同 时 对 模拟 样本 的 容量 问题 进行 初步 的 分 


析 ， 痢 述 Bootstrap 模拟 和 MCMC 模拟 方法 及 应 用 ， 最 后 通过 几 个 简单 例子 
来 说 明 模 拟 方法 在 保险 精算 中 的 应 用 。 

”实际 问题 中 ， 由 于 影响 系统 的 因素 很 多 ， 在 建立 系统 模型 时 常 作 某 些 
假设 ， 而 对 某 些 因素 则 需要 忽略 不 计 或 将 几 个 因素 合并 考虑 。 为 了 使 分 析 
结果 更 加 切合 实际 ， 还 要 进行 灵敏 度 分 析 ， 即 在 固定 其 他 因素 不 变 的 条 件 
下 分 别 对 感 兴趣 的 因素 作 变 动 ， 并 观察 其 对 最 后 结果 的 影响 。 这 样 就 能 对 
真实 结果 与 分 析 结 果 的 偏离 有 所 认 知 并 预先 采取 相应 的 对 策 。 


$13.2 均匀 分 布 随 宙 数 与 伪 随 负数 


13.2.1 原 理 
产生 均匀 分 布 的 随机 数 是 进行 随机 模拟 的 基础 。 为 了 清楚 地 说 明 这 一 
点 ， 以 计算 定 积分 | /(*) dx 为 例 ， 由 微 积分 学 的 基本 原理 可 知 ， 若 被 积 本 


数 拟 zx) 的 原 函 数 F(x) 存 在 ， 则 可 以 采用 牛顿 一 莱 布 尼 兹 公式 求 其 值 。 但 实 
际 上 被 积 函 数 往 往 比 较 复 条 难以 求 得 其 原 函 数 ， 尤 其 是 多 变量 情形 下 的 重 
积分 计算 问题 。 这 时 ， 也 可 以 从 另 一 个 不 同 的 角度 来 考虑 这 个 问题 。 

设 U 是 [0, 1] 区间 上 均匀 分 布 的 随机 变量 ,利用 被 积 洋 数 信 x) 构造 一 


个 新 的 随机 变量 = /( VU)， 由 概率 论 的 基本 原理 可 知 ; B(E) = | f(%) dx， 





所 以 [f(a 的 近似 计算 问题 转变 为 数学 期 望 E(&) 的 估计 间 题 。 


由 数理 统计 学 的 基本 原理 可 知 ， 随 机 变量 的 样本 均值 = 上 允 x, 是 


对 其 数学 期 望 ECE) 的 较 优 的 估计 ， 但 是 专 本 身 无 法 直接 观测 ， 我 们 可 以 通 
过 UV 的 观测 样本 来 构造 & 的 样本 。 具 体 步 又 如 下 : 
利用 某 种 手段 产生 [0, 1] 上 相互 独立 且 服 从 均匀 分 布 的 4 个 随机 数 v， 


，*…，w,， 即 为 U 的 样本 ， 则 所 求 定 积分 | f(x) dx 的 近似 计算 公式 为 : 


[fds = 二 六 /Cu) i 


该 近似 方法 对 于 多 重 积 分 的 计算 特别 适用 。 这 也 是 随机 模拟 基本 思想 的 一 
种 体现 。 

在 上 面 的 方法 中 如 何 产 生 [0, 1] 上 均匀 分 布 的 个 随机 数 wu,，w,，…， 
uw 是 随机 模拟 的 关键 。 现 已 有 很 多 方法 用 于 产生 均匀 分 布 的 随机 数 ， 对 这 
些 方法 通常 要 求 满足 以 下 条 件 : 

1. 统计 特性 好 : 要 求 随机 数 的 分 布 共 有 一 定 的 均匀 性 ， 即 所 得 数列 的 


" 322 ， 


统计 性 质 与 [0, 1] 上 均 久 分布 的 样本 相同 ， 或 至 少 相 当 近 似 。 
2. 循环 周期 长 : 一 般 的 随机 模拟 都 要 有 成 千 上 万 个 随机 数 ， 而 任何 随 
机 数 生 成 方法 都 会 出 现 周期 性 的 重复 ， 也 称 为 随机 数 的 循环 周期 。 若 随机 
数 在 较 短 的 周期 内 就 发 生 循环 ， 即 使 增加 模拟 的 次 数 也 无 法 解决 这 个 问题 。 
3. 计算 简便 : 需要 相对 较 少 的 步骤 产生 一 个 随机 数 ， 以 使 计算 本 身 比 
较 方 便 。 


0 


产生 均匀 分 布 随 机 数 的 方法 ， 大 致 可 分 为 三 类 。 

第 一 类 方法 为 检索 法 ,就 是 事先 将 一 些 服从 均匀 分 布 的 随机 数 编 成 表 
格 ， 需 要 时 直接 从 这 一 表格 中 取 用 。 当 进行 模拟 时 ， 需 先 将 该 表 输 入 计算 
机 。 这 样 做 要 占用 一 定 的 存储 单元 ， 现 已 较 少 采用 。 只 是 在 进行 手工 模拟 
时 ， 仍 可 使 用 该 方法 。 需 要 注意 的 是 使 用 随机 数 表 时 必须 保持 读 表 取 数 的 
随机 性 。 

第 二 类 方法 是 物理 方法 ， 就 是 把 具有 随机 性 质 的 物理 过 程 变 换 为 随机 
数 ， 比 如 以 放射 性 物质 为 随机 源 的 放射 随机 数 发 生 器 等 等 ， 可 以 获得 真正 
的 随机 数 。 将 发 生 器 与 计算 机 连接 ， 模 拟 时 随时 调用 。 但 由 于 增加 了 硬件 
设备 ， 因 而 增加 了 费用 和 维护 工作 ， 又 无 法 对 模拟 问题 进行 复 算 检 查 ， 故 


降低 了 其 使 用 价值 。 

第 三 类 方法 是 数学 方法 ， 是 被 广泛 采用 的 一 种 方法 ， 实 质 上 是 利用 了 
计算 机 的 算术 和 次 辑 运算 的 能 力 。 首 先 给 定 一 组 初 值 : ww, wl, …， UL 
uw_uw)， 然 后 用 一 个 适当 的 数字 递 推 式 : 

uu, =g(U 1, Uy, ,Ut), n=1,2,… (13. 2.2) 
可 逐步 求 出 ul，w,，…， 从 而 产生 具有 均匀 总 体 随机 子 样 性 质 的 随机 数 。 


由 于 计算 机 所 能 存 贮 的 字 节 数 有 限 ， 只 能 表示 有 限 个 不 同 的 数 ， 不 能 
产生 真正 连续 分 布 的 随机 数 ， 而 且 得 到 的 序列 是 用 算法 产生 的 ， 这 些 生 成 
的 数 在 本 质 上 是 确定 的 ， 因 此 ， 在 采用 式 (13.2.2) 递 推 产生 的 序列 达到 
一 定 长 度 后 ， 或 退化 为 零 ， 或 周期 性 循环 出 现 。 所 以 这 样 的 随机 数 只 能 称 
为 伪 随 机 数 。 

产生 擅 随 机 数 的 方法 很 多 ， 下 面 介 绍 最 常用 的 算法 乘 同 余 法 。 

给 定 的 初 值 wo。( 又 称 种 子 ) ，z 为 自然 数 ， 取 正 整 数 所 和 mm， 按 下 面 
的 公式 递 推 求 出 : 

w, = kw,._,( modm) 
(0<w,<m) (13.2.3) 
u, = W/m 
其 中 mod 表示 模 数 运算 。 显 然 ， 有 0<u, <1 成立 。 
乘 同 余 法 又 称 为 一 阶 线性 同 余 法 ， 它 是 混合 同 余 法 的 一 个 特例 。 用 混 


合同 余 法 产生 随机 数 的 递 推 式 为 : 


20 = Ew + hw + + kw,.,+1(modm) 


(0<w,<m) (13.2.4) 
LU。 = Ww /mM 
这 里 的 kh、m 和 初 值 we 都 是 正 整 数 。 

其 上 面 的 定义 容易 看 出 ， 用 混合 同 余 法 〈 包 括 乘 同 余 法 ) 产生 随机 数 
时 ， 由 于 0 到 zw, 反 吧 ， 所 以 ww. 是 有 限 的 ， 故 随机 数 一 定 存在 某 个 正 的 周期 ， 
也 就 是 说 从 某 个 正 整 数 p 开始 有 : 

ws =w,, (n=1,2,..) (13.2.5) 
因此 ， 从 p+1 项 开始 ， 由 混合 同 余 法 产生 的 数列 开始 重复 ,产生 周期 现 
象 。 周 期 越 长 ， 不 重复 的 随机 数 也 越 多 ， 也 越 符 合 均匀 总 体 随 机 子 样 的 统 
计 性 质 。J]. G. Skellam 建议 在 乘 同 余 法 中 取 到 =999 563 及 =470 001。 

也 可 以 考虑 高 阶 的 同 余 法 ， 二 阶 、 三 阶 线 性 同 余 法 的 递 推 公式 如 下 : 
w, = kw + kw,.. +I(modm) 
(13. 2.6) 
wu, =w,/m 


20 = kw + kw, 2 +hkw,. +I(modm) 


(13.2.7) 


u, = 20 /Mm 
表 13 -1 中 列 出 了 Skellam 建议 的 m、k,、k, 和 的 值 ， 阶 数 为 s 的 同 
余 法 对 应 的 周期 为 ms -1。 


表 13 -1 高 阶 同 余 法 的 参数 选择 示范 
















999 563 470 001 


2 998 917 366 528 508 531 
2 999 563 254 754 529 562 
3 997 783 360 137 519 815 616 087 
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286 588 434 446 388 251 











上 述 各 种 产生 随机 数 的 数学 方法 都 是 基于 某 个 递 推 公式 ， 故 在 这 些 随 
机 数 之 间 必 然 存 在 一 定 的 相关 关系 ， 因 此 在 使 用 这 些 随 机 数 之 前 必须 对 其 
进行 统计 检验 。 对 [0, 1j 区 间 均 匀 分 布 的 随机 数 ， 可 采用 卡 方 检验 法 检验 
其 均匀 性 ， 用 相关 系数 法 检验 其 独立 性 。 如 果 经 统计 检验 随机 数 不 符合 要 
求 ， 就 需要 改变 生成 方法 中 的 参数 或 对 随机 数 进 行 改 进 。 如 果 所 得 数列 能 
通过 统计 检验 ， 则 认为 其 统计 特性 较 好 。 研 究 表明 ， 用 乘 同 余 法 所 得 的 随 
机 数列 ， 性 质 较 为 良好 。 

有 了 [0, 1] 区 间 均 匀 分 布 的 随机 数 ， 可 以 自然 地 导出 任意 区 间 [a, 6] 
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上 均匀 分 布 的 随机 数 s,， 只 要 将 [0, 1] 区 闻 均 匀 分 布 随机 数 uw, 经 过 线性 变 
换 =a+(-a)z 即 可 。 因 此 ， 产 生 [0, 1j 区 间 上 均匀 分 布 的 随机 数 是 随 
机 模拟 问题 的 基础 。 也 正 是 由 于 这 个 原因 ， 在 各 种 应 用 统计 软件 中 都 预 设 
了 产生 [0, 1] 区间 上 均匀 分 布 的 随机 数 的 程序 ， 可 以 直接 调用 。 如 最 常用 
的 表格 计算 工具 Microsoft Excel 中 ， 只 要 启动 “函数 ”功能 中 的 “RAND” 
函数 ， 就 能 获得 [0, 1] 区 间 上 均匀 分 布 的 随机 数 。 当 然 ， 在 计算 机 上 使 用 
函数 产生 的 随机 数 也 是 伪 随 机 数 。 


$13.3 一般 分 布 随机 数 


13.3.1 几 种 主要 方法 的 介绍 


在 均匀 分 布 随机 数 的 基础 上 ， 就 可 以 对 服从 各 种 概率 分 布 的 随机 变量 
进行 模拟 ， 进 而 模拟 各 种 复杂 的 实际 系统 。 在 均匀 分 布 随机 数 基础 之 上 产 
生 其 他 分 布 随机 数 的 数学 问题 可 表达 为 : 已 有 来 自 均 匀 分 布 总 体 U[0, 1] 
的 随机 数 uw， 对 于 随机 变量 对 ~F(x) ， 试 求 来 自 于 总 体式 的 子 样 x。 

常见 的 方法 有 四 种 : 反 函 数 法 、 取 舍 法 、Box - Muller 方法 和 极 方 法 ， 
它们 可 分 别 用 于 产生 各 种 分 布 的 随机 数 。 现 对 它们 分 别 介 绍 如 下 : 

1. 反 另 数 法 。 设 随机 变量 的 分 布 隧 数 为 f(x) ， 定 义 

Fi(u) =inf{fx:F(x) >u}, O<u<l (13.3.1) 
假设 随机 变量 U 服 从 (0, 1) 上 的 均 色 分 布 ， 则 随机 变量 “(UVU) 的 分 布 函 数 
是 F(x) ， 即 在 分 布 相等 的 意义 上 有 =F (UU)。 

要 证 明 x 为 所 要 求 的 随机 数 ， 只 要 证 明 所 构造 的 随机 变量 "(UVU) 具 有 
分 布 函 数 F(x) 即 可 ， 事实 上 ,对 = "'(U) 的 分 布 函 数 为 : 

P(XS<x) =P(F (UVU) <x) =P(F(F (UVU))<F(x)) 
=P(U<F(x)) =F(x) 

具体 步骤 如 下 : 

(1) 由 U(0, 1) 抽 取 zi; 

(2) 计算 x=z (wu)， 其 中 如 式 (13.3.1) 中 定义 。 

以 上 步骤 的 含义 是 ， 若 已 知 分 布 函数 F(x)， 只 要 产生 一 个 均匀 分 布 随 
机 数 w， 对 应 的 取 分 布 F(x) 的 4 分 位 点 即 可 。 形 象 地 说 就 是 ， 由 均匀 分 布 
随机 数 w 确定 了 纵 坐 标 ， 然 后 根据 分 布 ， 找 对 应 的 原 象 ( 横 坐 标 ) 。 如 果 
纵 坐 标 w 有 多 个 原 象 (多 个 横 坐 标的 函数 值 相等 )， 由 式 (13.3.1)， 则 取 
数值 最 小 的 原 象 x。( 模 坐标 ) ， 见 图 13 - 1。 如 果 纵 坐标 4 没有 对 应 的 原 象 
(zz 不 在 分 布 函 数 的 值 域 中 ) ， 则 取 值 域 中 大 于 w 且 最 接近 w 的 纵 坐 标 v 的 原 
象 x;,， 即 跳 暑 发 生 时 的 横 坐 标 ， 见 图 13 -2。 





图 13 -1 一 个 特殊 情况 时 分 位 点 的 取 法 图 13 -2 有 跳跃 时 分 位 点 的 取 法 


如 果 F(x) 是 连续 且 严 格 单调 的 ， 则 F (zu) 为 下 的 反 函 数 。 当 分 布 形 
式 简 单 时 ， 可 以 直接 计算 反 函 数 ， 如 指数 分 布 。 但 有 些 分 布 的 反 跑 数 没 有 
显 式 ， 如 正 态 分 布 ， 这 时 只 能 数值 计算 或 采用 其 他 方法 。 

2. 取舍 法 。 若 三 的 分 布 密度 函 数 . 败 x) 可 以 表示 为 .zx) =c h(x).g 
(x) ， 其 中 c 宇 1 为 常数 ，#(xz) 是 一 个 相对 简单 〈 易 于 获得 分 布 函 数 道 函数 
的 解析 表达 式 ) 的 密度 隔 数 ， 因 此 假定 已 有 现成 的 方法 获得 分 布 密度 为 
(x) 的 随机 数 ， 另 外 有 0 <g(x) 志 1。 首 先 产 生 均 匀 分 布 随机 数 w 和 密度 取 
数 为 h(x) 的 随机 数 y， 若 wg(y)， 则 令 x=y， 否 则 重新 生成 均匀 分 布 的 
随机 数 w 和 有 h(x) 的 随机 数 y， 直 至 满足 条 件 。 

为 了 证 明 x 是 所 要 求 的 随机 数 ， 只 需 证 明 世 的 分 布 密度 为 Kx)。 考 虑 
分 布 函数 为 F(xz) 的 开 、 密 度 函 数 为 xz) 的 了 以 及 均匀 分 布 的 [0, 1] ， 三 
者 的 关系 式 如 下 : 

F(x) =P(X<x) =P(Y<xIUSg(Y)) 


_P(Y<x, Ug(Y)) 
~ P(U<eg(Y)) 





由 于 P(U < g(Y)) = [Pv <g(s) | Y = s)h(s)ds = [gCs)nCs) ds = ec 


以 及 P(Y <x,U < g(Y)) [Pl(Y < >， UVU<e(s)!Y = s)h(s)ds 


[PlU < e(s))h(s) ds 


[els) RCs) ds 


因此 有 F(x) = c [gls)h(s) ds ， 亦 即 邯 的 密度 为 /(x)。 


3. Box-Muller 方法 。 首 先 产生 [0, 1] 区 间 上 两 个 独立 的 均匀 分 布 随机 
数 wu， 和 zu,， 令 : 
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1 
x) =( -21lnu,)?cos(27u,) 


x, =( 本 (13. 3.2) 
则 x, 和 x, 是 两 个 独立 的 、 服 从 标准 正 态 分 布 的 随机 数 。 
Bux-Mulle 方法 的 原理 是 ， 由 式 (13.3.2) 可 以 推出 以 下 关系 式 : 








ul =e -六 (4 +x2) i -7an [2] 
27 EA 
则 du 三 we -YT(H +e) ， Om _ we -Fn +x2) 
0X1 0X, 
ou, 1 1 x) Ou _1 1 1 
OX 2 | ET 
Xi 和 Xi 
这 时 变换 的 Jaccobi 行列 式 为 : 
Ou Ou _ OW Ou | __ 1 -+(x + 避 ) 
OXx| dX, dX, OX 27 











由 于 UV,，U, 是 [0, 1] 上 独立 的 均 久 分布， 可知 处 ,，X, 的 联合 分 布 密度 为 : 


dt 


27 V27 V27 








即 X, ，*, 是 相互 独立 的 N(0, 1) 随 机 变量 。 


4. 极 方 法 。 极 方法 实际 上 是 Box-Muller 方法 的 特例 。 首 先生 成 在 [ -1， 


“1] 区 间 上 均匀 分 布 的 随机 数 凡 各 ; 令 v.=2u 一 1，i=1,2; 以 及 p = 芝 + 


2。 若 p >1， 重 新 产生 wl 和 wu,， 否 则 , 令 


= /2 (13. 3.3) 


则 x,，zx, 是 相互 独立 的 N(0, 1) 随 机 变量 的 随机 数 。 

若 要 生成 均值 为 人 ， 方 差 为 rw 的 正 态 分 布 的 随机 数 ， 可 先 得 到 标准 正 
态 分 布 的 随机 数 ， 然 后 将 该 数字 乘 以 o 并 加 上 内 即 可 得 到 N(j, o") 随 机 变 
量 的 随机 数 。 


【 例 13 -1】 设 随机 变量 X 服 从 指数 分 布 ， f(x) = 亡 。”，% >0， 请 利 


用 反 隆 数 法 ， 根据 [0, 1] 区 间 均 久 分 布 的 随机 数 u,，u,，… 来 表示 随机 变 
量 天 的 随机 数 。 
解 : 指数 分 布 的 分 布 函 数 为 : 
F(x)=1-e™, x>0,0>0 
其 反 郴 数 为 下 (xz) = -0ln(1 -wu)。 因 此 ， 要 生成 均值 为 9 的 指数 分 布 的 随 
机 数 x*， 采 用 以 下 两 个 步骤 : 





第 一 步 : 生成 [0, 1] 区 间 均 匀 分 布 的 随机 数 vi 

第 二 步 : 邻 x=F''(u) = -0ln(l -wu)。 

值得 注意 的 是 ,车 UU 服从 (0, 1) 均 匀 分 布 ， 则 1 - 避 仍 然 是 服从 (0, 1) 均 勾 
分 布 ， 所 以 1 -仍然 是 (0,，1) 均 匀 分 布 的 随机 数 。 又 由 于 分 布 函数 是 单调 递增 
的 ， 小 的 数值 对 应 的 分 位 点 也 要 小 ， 所 以 对 于 较 小 的 均匀 分 布 的 随机 数 和， 如 果 
取 w 对 应 的 分 位 点 ， 则 意味 着 小 的 随机 数 产 生 小 的 模拟 数 ; 如 果 取 1 -wu 对 应 的 
分 位 点 ， 则 意味 着 小 的 随机 数 产 生 大 的 模拟 数 。 例 如 在 例 13 -1 中 ， 可 得 到 另 
一 个 指数 分 布 的 随机 数 x’= -bn(1-(1-z))= -60ln(u)。 

【 例 13 -2】 利用 [0, 1] 区 间 均 名 分 布 的 随机 数 w,，wu,，… 表 示 服 从 帕 
累 托 分 布 的 随机 数 。 

解 : 设 针 服从 帕 累 托 分 布 ， 则 


at -(z) 





a 1 
由 =F.(*) 得 出 w=1- (二 4 可] ,所 以 x,=0(1 -w)-a-9 即 为 所 求 。 


【 例 13 -3】 试 产生 标准 正 态 分 布 的 随机 数 。 

解 : 因为 正 态 分 布 函 数 的 反 函 数 不 容 易 给 出 解析 表达 式 ， 因 此 不 宜 采 
用 反 函 数 法 。 但 Box - Muller 方法 和 极 方法 都 可 以 直接 应 用 。 

由 于 正 态 分 布 在 统计 理论 中 占有 重要 地 位 ， 所 以 在 数理 统计 理论 和 实 
践 中 常常 将 标准 正 态 分 布 的 分 布 函数 做 成 表格 ， 利 用 标准 正 态 分 布 表 和 均 
匀 分 布 随机 数 表 就 可 得 到 标准 正 态 分 布 的 随机 数 。 

具体 步骤 为 : 首先 得 到 [0, 1] 均 匀 分 布 的 随机 数 w， 然 后 在 标准 正 态 分 
布 函数 表 中 找到 使 B(x) =w 成立 的 x 值 ， 则 此 x 是 标准 正 态 分 布 函数 的 一 
个 随机 数 。 比 如 从 均匀 分 布 随 机 数 表 中 得 到 随机 数 0.02488 ， 查 标准 正 态 分 
布 表 可 知 四 ( -1.962) =0.02488， 即 标准 正 态 随 机 数 为 -1.962。 这 种 方法 
也 可 在 计算 机 上 使 用 ,但 存 贮 标准 正 态 分 布 表 也 需要 占用 一 定 的 空间 。 

还 有 一 种 方法 是 利用 中 心 极 限定 理 。 由 中 心 极 限定 理 ,， 由 nn 个 [0,1] 
区 间 均 勾 分 布 的 随机 变量 U0,,U,,…,U, 生成 的 随机 变量 : 


x =-[ 袜 局 -下 /大 (13.3.4) 


当 足够 大 时 近似 服从 标准 正 态 分 布 。 
所 以 ， 首 先生 成 [0, 11 区 间 均 匀 分 布 的 nz 个 随机 数 wu ,2， 然 后 
代 人 式 (13.3.4) 计算 得 到 的 x 即 为 标准 正 态 分 布 的 随机 数 。 
车 n=12， 则 式 (13.3.4) 简化 为 : 
六 = 2 U,—6 


或 站 =U t+U-(1-U,)-.…-(1-U,) 


* 327- 


精算 模型 


328 ， 


又 由 于 VU, 和 1 ~U, 都 是 [0, 1] 上 的 均 句 分布， 也 可 选取 以 下 的 随机 数 : 
X=Ut+t tue —U — Uy (13.3.5) 
在 对 计算 速度 要 求 较 高 ， 且 对 正 态 分 布 的 尾 端 分 布 情况 要 求 不 高 时 ， 

这 一 方法 适用 。 

【 例 13 -4】 试 生成 参数 为 =5.0，o =4.0 的 对 数 正 态 分 布 的 5 个 
随机 观察 值 。 
解 : 若 要 生成 对 数 正 态 分 布 的 随机 数 ， 可 以 先生 成 标准 正 态 分 布 的 随 

机 数 ， 然 后 经 过 参数 变换 生成 相关 正 态 分 布 的 随机 数 ， 再 对 结果 进行 指数 

变换 就 可 得 到 要 求 的 对 数 正 态 分 布 随机 数 。 

表 13 -2 给 出 了 生成 5 个 对 数 正 态 随机 数 的 上 述 各 步骤 的 中 间 结 果 。 





表 13 -2 例 13 ~4 对 数 正 态 分 布 随机 数 
随机 数 标准 正太 分布 隧 机 效 正 态 分 布 随机 数 对 数 正 态 分 布 随机 数 
Bl(u) p+oB li(u) =5+29-!(u) exp[5 +2® 1(u)) 

0. 81525 0.90 6. 80 | 897.8 

0. 29676 -0.53 3. 94 51.4 

0. 00742 -2.44 0. 12 1.1 

0. 05366 -1.61 1.78 5.9 

0. 91921 1.40 7. 80 2 240.6 











【 例 13 -5】 试 生 成 伽 玛 分 布 (参数 为 a - 正 整 数 ，y >0) 的 随机 数 。 
解 : 伽 玛 分 布 的 反 画 数 不 能 给 出 解析 表达 式 ， 这 时 可 根据 伽 玛 随机 变 
量 与 指数 随机 变量 的 关系 得 到 生成 伽 玛 随机 数 的 一 种 特殊 方法 。 我 们 知道 ， 
“个 参数 均 为 y 的 指数 分 布 随机 变量 之 和 服从 伽 玛 (a, y) 分 布 ， 即 关 蕊 服 


从 参数 为 y 的 指数 分 布 ，1<i<a， 则 部 XX 服从 伽 玛 Ca, y)。 因 此 ， 为 了 
生成 伽 玛 (a, y) 的 随机 数 ， 可 首先 生成 a 个 均值 为 y 的 指数 分 布 随机 数 : 
< = -yn(1 -ui)，1<i<a。 这 里 wu 为 均匀 分 布 随机 数 ， 然 后 将 这 a 个 随 
机 数 相 加 得 到 伽 玛 (a, y) 的 一 个 随机 数 y = 了“ = -yYlin(1 -u) 。 

【 例 13 -6】 试 生 成 好 (m) 分 布 的 随机 数 。 

解 : 这 里 的 基本 原理 是 : 车 X,，X,，-…，X, 是 个 独立 同 分 布 的 标 
准 正太 分布 随机 变量 ， 则 祥 到 服从 自由 度 为 = 的 巡 分 布 。 因 此 ， 要 生成 


和 《nn) 分 布 的 随机 数 ， 首 先生 成 n 个 标准 正 态 分 布 随 机 数 ， 然 后 将 这 个 
随机 数 的 平方 求 各 即 为 所 求 的 x (n) 随 机 数 。 


13.3.3 离散 随机 变量 的 模拟 


SD 


设 离散 型 随机 变量 了 的 概率 分 布 为 P(X=a.) 三 Pp;， i=1, “** ,No 其 中 
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pi >0， > P， = 1 ， 并 且 设 ao <a <… <a.。 根 据 反 歼 数 原理 ， 对 均匀 分 布 随 


机 数 4， 只 需 找 整 数 j， 满 足 本 p, < u < 下 p; ， 则 无 的 模拟 值 取 mw。 


有 的 时 候 ， 要 将 卫 的 各 种 可 能 事件 a, 的 概率 全 部 进行 计算 过 于 繁杂 ， 
因此 对 于 不 同 的 分 布 可 采用 不 同 的 特定 方法 。 

【 例 13 -7】 考虑 模拟 贝 努 里 随机 变量 的 方法 。 

解 : 若 不 为 贝 努 里 随机 变量 ， 成 功 概率 为 p， 失 败 的 概率 为 9=1 一 p。 
通常 ， 若 随机 数 在 区 间 [;, 1] 上 ， 则 说 明 试 验 失 败 ; 否则 说 明 试 验 成 功 ， 
即 vxe[0,P)。 

【 例 13 -~8】 考虑 模拟 泊 松 分 布 的 方法 。 

解 : 泊 松 分 布 常 被 用 于 表示 索赔 次 数 的 分 布 ， 概 率 分 布 为 : 

入“e 


p:=P(X=E) = 


k=0,1,- 


其 中 参数 和 =E( 久 ) 表示 平均 索赔 次 数 。 
方法 一 : 可 以 直接 应 用 反 哨 数 法 来 生成 泊 松 随机 数 ， 记 : 


A 


oo=e 
be = FF ,+ Eh 
n 六 nl p, 


然后 执行 以 下 步骤 : 
” (1) 生成 [0, 1] 区 间 均 匀 分 布 随 机 数 u; 
Cy ee 
(3) 车 存在 某 个 k>0 使 得 F<u < 下 ,， 则 令 %=k。 
方法 二 : 分 数 乘积 法 ， 主 要 是 基于 以 下 事实 : 车 两 次 相继 发 生 的 事件 
之 间 的 时 间 间 隔 系列 7,，7,，… 独 立 且 服 从 均值 为 17A 的 指数 分 布 ， 则 在 
单位 时 间 段 内 事件 发 生 的 次 数 卫 服从 参数 为 的 泊 松 分 布 (参见 第 七 章 ) 。 
记 子 为 单位 时 间 段 内 事件 发 生 的 次 数 ， 则 五 与 7, 有 以 下 关系 式 成 立 : 


yr<1< 77 (7T, = 0) (13. 3.6) 
所 以 首先 需要 得 到 7 的 随机 数 ， 由 模拟 指数 分 布 的 方法 知 ， 若 ,i = 1 
2，… 为 [0,，1) 区 间 均 匀 分 布 的 随机 数 ， 则 : 4 = -lnu; 为 7 的 随机 数 。 
由 式 〈13.3.6) ， 存 在 某 个 满足: 


1 工 十 1 1 
一 一 ln 委 1 < — 一 -ln ，， 2&。 = 1 
之 -人 nu 之 A 。 


两 边 同 乘 以 -入 可 得 : 


贡 : z+l 
lnz . 之 一 lnu. 
之 QUi; 之 一 和信 > 2 nu, 
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用 IT 宇 e* > I (13.3.7) 
则 满足 式 (13.3.7) 的 x 为 泊 松 分 布 的 一 个 随机 数 。 
具体 的 操作 方法 如 下 : 首先 从 0 点 开始 , 若 e” > 由 ， 则 令 * =0; 否 


则 ， 继 续 比 较 , 车 e”>w,* wu,， 则 令 x=1; 依 此 继续 ， 直 至 存在 某 个 k 首 
次 满足 : e* > [[” 。 所 以 ， 这 个 方法 常常 需要 多 个 [0, 1] 均 匀 分 布 的 随 
机 数 。 

考虑 生成 5 个 参数 和 =0.5 的 泊 松 分 布 的 随机 数 。 由 已 知 条 件 有 : e ”= 


0. 60653 ， 首 先 产生 一 列 [0, 1] 均 匀 分 布 的 随机 数 ， 例 如 0. 68379 ，0. 10493 ， 
0. 81889 ，0. 81953 ，0. 35101 ，0. 16703 ，0. 83946 ，0. 35006 ，0. 20226 ，.… ， 然 


后 按照 上 面 的 方法 逐步 的 选取 。 计 算 过 程 和 结果 列 在 表 13 -3 中 。 





表 13 -3 泊 松 分 布 的 随机 数 (分 数 乘积 法 ) 

工 十 1 x 
序号 I Tx: 随机 数 x 

i=0 i=0 

1 0. 68379 x0. 10493 =10. 07175 0. 68379 下 

2 0. 81899 x0.81953 x0.35101 =0. 23559 0.81899 x0. 81953 =0. 67119 过 

3 0. 16703 1 0 

4 0. 83946 x0. 35006 =0. 29386 0. 83946 i 

5 0. 20226 1 0 











这 种 方法 在 A 较 大 时 ， 计算 过 程 将 变 得 复杂 而 且 计 算 量 增 大 ， 这 时 也 
可 以 考虑 采用 中 心 极 限定 理 来 减少 计算 量 。 . 

方法 三 : 中 心 极限 定理 近似 。 根 据 中 心 极限 定理 ,在 入 很 大 时 ,参数 
为 A 泊 松 分 布 可 用 均值 为 A， 标准 差 为 VA 的 正 态 分 布 来 近似 。 因 此 可 采用 
如 下 的 方法 生成 泊 松 分 布 随机 数 : 

第 一 步 : 生成 均匀 分 布 随机 数 4; 

第 二 步 : 计算 相应 的 标准 正 态 随机 数 z: 

第 三 步 : 计算 入 +z VA; 

第 四 步 : 按照 4 舍 5 人 的 原则 ， 选 取 与 A +z VA 最 接近 的 非 负 整数 ， 并 
以 此 作为 泊 松 分 布 随 机 数 x。 

例如 要 生成 泊 松 参数 入 =11 的 5 个 随机 数 ， 计算 过 程 和 结果 列 在 表 
13 -4 中 。 
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人 
表 13 -4 泊 松 分 布 的 随机 数 ( 正 态 近 似 法 ) 

随机 数 “ 标准 正 态 随机 数 z 11 +z Vil 泊 松 随机 数 x 

0.91567 1.38 15. 58 16 

0. 17955 -0.92 7.95 8 

0. 46503 -0.09 10. 70 11 

0. 92157 1. 41 15.68 16 

0. 14577 -1.06 7.48 7 











【 例 13 -9】 考虑 模拟 人 负 二 项 分 布 的 方法 (参数 为 k=6、p =0.6)。 
解 : 
方法 一 : 直接 采用 反 了 印 数 表 13 -5 负 二 项 分 布 表 














法 方法 生成 负 二 项 分 布 的 随机 (E=6, p=0.6) 
数 。 为 此 需要 首先 计算 概率 分 ji PN- 用 PINj| 
布 表 ,， 表 13 -5 列 出 了 参数 为 0 0. 0467 0. 0467 
k=6、p =0.6 的 人 负 二 项 分 布 的 1 0. 1120 0. 1587 
概率 分 布 值 。 然 后 基于 该 分 布 2 0. 1568 0. 3155 
按照 以 下 步骤 进行 : 3 0. 1672 0. 4827 
第 一 步 生成 [0, 1] 上 均 4 0. 1505 0. 6332 
名 分 布 随机 数 w， 5 0. 1204 0.7536 
第 二 步 : 若 uw <0.0467， 取 6 0. 0883 0. 8419 
随机 数 x =0; 否则 ， 继续 进行 ， 7 0. 6050 0. 9024 
若 0.0467<u<0.1587,， 取 x= 0 QL8 
1， 如 此 等 等 。 9 0. 0245 0. 9663 
方法 二 : 中 心 极限 定理 近 10 0.0147 0.9810 
似 。 当 人 负 二 项 分 布 的 参数 上 较 11 0. 0085 0. 9895 
大 时 ， 同 样 可 采用 中 心 极限 定 12 0. 0048 0. 9943 
Ee eg 13 0. 0027 0.9970 
生生 昌 。 14 0. 0015 0.9985 
ee) ei a 15 0. 0008 0. 9993 
oy 16 0.0004 0. 9997 
(2) 计算 得 到 相应 的 标准 ee ER 
正 态 分 布 随机 数 z; 一 一 一 一 一 一 一 一 一 一 一 一 


p V Pp 


(4) 按照 四 舍 五 人 的 原则 ， 选 取 与 et + /人 最 接近 的 非 


负 整 数 ， 并 以 此 作为 负 二 项 分 布 随机 数 x。 
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13. 3.4 混合 型 随机 变量 的 模拟 


Meera eanr 


如 果 一 个 分 布 函 数 f(x) 经 有 连续 部 分 又 有 离散 部 分 ， 则 其 对 应 的 随 
机 变量 为 混合 型 随机 变量 。 它 的 随机 数 * 的 生成 方法 为 : 如 果 [0,1] 均 勾 
分 布 的 随机 数 x 落 在 值 域 的 严格 连续 递增 的 部 分 ， 则 解 方程 F(x) =w; 如 
果 w 落 在 分 布 函 数 “ 跳 ”的 区 域 ， 则 随机 数 x 取 跳 发 生 的 点 。 
【 例 13 -10】 根据 [0, 1] 区 间 上 均匀 分 布 UV 的 随机 数 来 表示 如 下 密度 
函数 : 
x=0 
2 =[ 0 )Ae”, x>0 
的 随机 变量 的 随机 数 。 
解 : 当 w <p 时 ， 


当 w>p 时 ,w=p+(1-p)(1-e*), 解 得 x= -二 tn(i 区 。 


【 例 13 -11】 多 的 密度 函数 (x) 含有 以 下 性 质 : (1) f(x) =0, x<0; 
(2) f(0) =0.75; (3) f(x) =x ,0<x<1。 根据 [0, 1] 区 间 上 均匀 分 布 U 
的 随机 数列 0. 1，0.7，0. 8 产生 针 的 随机 数 。 

解 : 由 题 知 ，Ff(0) =0.75,， F(x) =0.25x +c,0<x<1，, 易 得 
出 c=0.75。 

根据 和 = Fi' (UVU)， 容 易 得 出 x, = 0, x, =0, x, = M4(0.8 -0.73) 
=0.6687。 





13.3.5 复合 型 随机 变量 的 模拟 


保险 风险 模型 中 的 总 损失 常常 需要 采用 复合 分 布 的 形式 进行 描述 ， 对 
于 由 承保 特征 比较 接近 的 保单 构成 的 某 类 保单 组 合 而 言 ， 若 索赔 次 数 用 高 
散 型 随机 变量 N 表示 、 每 次 索赔 的 金额 用 随机 变量 X, 表示 ， 则 索赔 总 量 就 
可 以 看 做 是 一 个 复合 型 随机 变量 。 最 常用 的 复合 型 随机 变量 是 复合 泊 松 分 
布 和 复合 负 二 项 分 布 的 随机 变量 。 在 第 6 章 中 已 对 它们 作 过 专门 讨论 ， 这 
里 仅 从 随机 模拟 的 角度 讨论 它们 的 分 布 。 
一 个 保险 期 〈 如 一 年 ) 内 的 索赔 总 损失 可 以 表示 为 : 
0 ， N=0 
s= |e 
人 N >0 
而 县 X ， 轩 独立 同 分 布 , 若 N 服从 泊 松 分 布 ， 则 称 $ 为 复合 泊 松 分 布 ; 
若 六 服从 负 二 项 分 布 ， 则 称 3 服从 复合 负 二 项 分 布 。 
实际 上 ， 有 了 前 面 关 于 连续 型 随机 变量 和 离散 型 随机 变量 的 模拟 方法 ， 
可 以 很 自然 地 得 到 复合 变量 的 模拟 结果 。 设 索赔 次 数 NN 服从 泊 松 分 布 ， 每 


次 索赔 蒜 服从 相同 的 分 布 ， 用 函数 F(x) 表 示 ， 要 产生 复合 泊 松 分 布 S 的 
随机 样本 ,一 个 简单 方法 就 是 对 NN 和 对 基 的 分 布 分 别 进行 模拟 ， 比 如 首先 
生成 泊 松 分 布 的 随机 数 mm ， 再 生成 mm 个 服从 分 布 F(x) 的 随机 数 x,,，x,， 


,zi 令 si = 允 % ， 则 。 为 复合 泊 松 分 布 5 的 一 个 样本 值 。 
复合 负 二 项 分 布 的 模拟 也 可 类 似 地 进行 。 


13. 3.6 正 态 随机 向 量 的 模拟 

前 面 讨论 的 所 有 模拟 都 是 对 随机 变量 背景 进行 的 ， 但是， 现实 中 常常 
会 出 现 随机 向 量 的 情景 ， 这 部 分 将 对 这 个 问题 给 出 一 些 方法 。 下 面 将 说 明 
假设 已 经 模拟 得 到 标准 元 正 态 随机 数 ， 则 可 以 通过 线性 组 合 得 到 任意 的 nm 
元 正 态 随 机 数 。 

记 维 (n 宇 2) 随 机 向 量 针 =(X,,…, XX,) ， 其 均值 为 凡 = (jp, pW， …， 
4,) ， 协 方差 矩阵 记 做 QO，0Q 的 第 i 行 j 列 元 素 为 o; = E[ (天 -Ai) (天 一 
Ap)]，i 7=1，2，…，,， 7m， 即 天 服从 分 布 WIA, 0)。 由 Q 的 定义 知 协 方差 
和 矩阵 Q 为 正定 和 矩阵， 根据 线性 代数 中 的 Choleski 分 解 知 ， 正 定 对 称 和 矩阵 Q 
可 以 表示 为 两 个 相同 的 非 奇异 矩阵 工 的 乘积 ， 即 Q =Z 工 。 其 中 ， 

lI 0 .… 0 
Ll, 2 让 流光 0 


当 0Q 的 分 解 式 中 的 工 为 对 角 和 矩阵 时 ， 可 证 明 和 ,…, 和 .是 相互 独立 的 随机 
变量 。 
设 Z=(2Z,,…, 2Z,) 是 nr 元 标准 正 态 随机 向 量 ,， 服从 分 布 N(0, 7)。 因 
为 正 态 随机 变量 的 线性 组 合 仍 是 正 态 随机 变量 ,， 而且 
E(LZ +1) =LE(Z) +u, Var( LZ +A) =LVar(Z)L =LL" 
可 知 开 = LZ + 人 服从 分 布 N(x，Q)。 所 以 产生 WCG, Q) 随 机 向 量 的 算法 
如 下 : 
(1) 产生 个 独立 同 分 布 的 标准 正 态 随 机 变量 ， 以 向 量 z= (z，, z,， 
z,)' 形式 记录 ; 
(2) 按 公 式 x=j+L:z 计 算 n 维 随机 向 量 x=(x,, x,,…, x,) ， 即 : 
二 二 0 汪汪 
【 例 13 -12】 某 公 司 的 资产 分 布 于 股票 、 债 券 和 国定 资产 几 个 部 分 。 


高 级 管理 层 希 望 了 解 公 司 次 年 资产 总 额 的 情况 ,显然 上 述 三 类 资产 次 年 的 
价值 是 随机 的 ， 所 以 以 随机 向 量 瑟 = (X,, X,, X,)" 的 三 个 分 量 分 别 代 表 公 
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司 当 前 的 资产 组 合 中 股票 、 债 券 和 固定 资产 的 次 年 价值 。 研 究 表明 ， 这 三 
个 随机 变量 的 均值 和 协 方差 矩阵 〈 以 百 万 元 为 单位 ) 分 别 为 : 


4 -0.1 0. 4 
Hp=(3,，1,1.5)" ， QQ=| -0.1 2 一 0. 21 
0. 4 -0.21 1 


试 采 用 多 元 正 态 分 布 的 随机 模拟 模型 计算 公司 次 年 的 资产 总 值 超过 700 万 
元 的 概率 。 
解 : 这 里 用 100 次 模拟 试验 来 解决 该 问题 。 为 了 说 明 模 拟 过 程 ， 下面 
用 某 次 假想 的 试验 进行 说 明 ， 这 里 选用 的 数据 是 为 简化 计算 方便 说 明 ， 而 
非 实 际 的 随机 数 。 首 先 计 算 三 角 和 矩阵 工 : 
2 0 0 
L"=| -0.05 2 0 
0.2 -0.1Y2 0.2 
接 下 来 考虑 三 个 标准 正 态 分 布 随 机 数 构成 的 随机 向 量 : 
z=(z, 22) =(1, -0.5,-1)" 
这 里 的 数字 进行 了 适当 的 简化 ， 以 便于 简化 计算 。 则 有 


2 -0.05 0.2 1 4. 825 
X = 人 凡 十 过 zxz= +|0 /2 -0.1.2 1 -0.5|=|1-0.4/2 
1. 0 0.2 -1 1.3 
故 这 次 试验 得 到 的 次 年 资产 总 额 为 : 
4.825 \ 71 
1-0.4.2 ||1 |~6.559 
1.3 1 
近似 为 660 万 元 。 


100 次 模拟 结果 列 在 表 13 -6 中 ， 并 对 结果 作 了 升序 排列 。 通 过 对 这 些 
试验 结果 进行 分 析 ， 我 们 发 现 从 编号 为 67 (结果 用 黑色 标 出 ) 的 试验 开始 
资产 总 额 超过 了 700 万 元 ， 这 表明 在 100 次 试验 中 有 34 次 试验 的 总 额 超过 
了 700 万 元 ， 因 此 所 估计 的 概率 为 0. 34。 



































表 13 -6 例 13 -12 的 计算 结果 单位 : 百 万 元 
试验 编号 | ”股票 债券 ”| 固定 资产 | 总额 “| 试验 编号 | 股票 债券 ”| 固定 资产 总 额 
1 1.00 0.82 0.47 2. 29 S1 3. 11 2.57 0.15 5.83 

2 0. 43 1.71 0. 28 2. 42 52 1.69 2. 12 2.08 5. 89 

3 1.71 0.42 0.41 2.54 53 3.80 0.92 1 5.94 

4 0.09 1.49 1.24 2. 82 54 A 1.35 1.90 6.00 

5 1.02 下 0. 68 2. 87 55 2.00 0. 91 3. 17 6.08 
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42 0. 24 3. 94 | 1.14 5.32 92 5. 86 1. 60 2.74 10. 20 
43 3. 22 0. 90 1. 20 5.32 93 7.75 1.47 1.06 10. 28 
44 3.49 1.37 0. 47 5. 33 94 4. 99 2. 31 3. 16 10. 46 
45 2. 17 1. 12 2.06 5. 35 95 7.03 0.32 3.44 10.79 
46 2.53 0.00 2. 88 5. 41 96 5.60 1.15 4.05 10. 80 
47 2.34 1.62 1.51 5.47 97 5.13 3.45 2.45 11.03 





















































13.4 模拟 标本 的 容量 


模拟 实验 次 数 或 模拟 样本 容量 影响 随机 模拟 成 败 的 一 个 重要 因素 。 
模拟 样本 的 大 小 取决 于 概率 分 布 的 形式 和 对 估计 值 的 精确 程度 的 要 求 。 一 
般 而 言 ， 对 估计 和 值 的 精确 度 要 求 越 高 ， 对 样本 容量 要 求 就 越 大 。 下 面 我 们 
举例 说 明 。 

假定 我 们 要 估计 贝 努 里 随机 变量 的 成 功 概 率 (或 均值 ) p， 得 到 了 容量 
为 n 的 随机 样本 ， 并且 以 样本 的 成 功 比率 5, 作为 p 的 估计 值 。 这 时 可 以 考 
虑 以 下 两 种 基本 问题 首先， 给 定 nn 和 a,，0<a<1, 求 满足 Pi1pb,-pl < 
sl =1-aw 的 s= 值 ; 其 次 ， 给 定 e 和 a，, 求 满足 上 式 所 需 的 样本 容量 n。 换 
而 言 之 ， 在 第 一 类 问题 中 ， 对 给 定 的 样本 容量 确定 估计 值 的 精确 度 ; 在 第 
二 类 问题 中 ， 对 给 定 的 估计 精度 ， 确 定 必 要 的 样本 容量 。 

特别 地 ， 取 a=0.01， n=100， 并 假定 bp 的 真 值 为 0.5 (p =0.5 时 得 到 
的 方差 最 大 ) ， 求 相应 的 s 值 。 这 里 可 以 将 nr 看 做 “充分 大 ”， 由 中 心 极 限 
定理 可 得 : 


.ap Pp.—P 


Wr 


可 以 用 标准 正 态 分 布 来 近似 。 由 正 态 分 布 孙 数 表 可 知 : 


P| -2.58 < <2. 58] =0.99 


即 P[ -0.129 < 方 -p<0.129] =P[!b, -pl <0.129] =0.99 
故 =0.129。 


性 








若 取 a =0.02，e =0.01， 通 过 类 似 的 方法 可 得 到 需要 的 样本 容量 nn 约 
为 13 526。 

在 一 般 的 随机 模拟 问题 中 都 会 事先 对 估计 值 的 精确 程度 作出 规定 ， 然 
后 按照 精度 确定 相应 的 模拟 样本 容量 ,这样 得 到 的 样本 容量 或 试验 次 数值 
一 般 都 很 大 (如 上 面 的 13 526)， 因 而 用 手工 计算 进行 模拟 几乎 是 不 可 能 
的 ， 必 须 进 行 计算 机 操作 。 

【 例 13 -13】 假设 随机 变量 子 的 均值 为 ,方差 为 o 。 通 过 模拟 来 估 
计 j。 

(1) 求 使 得 真 值 与 估计 值 的 相对 误差 不 大 于 5% 的 概率 为 0.9 所 需 的 
模拟 次 数 ; 

(2) 求 使 得 真 值 与 估计 值 的 相对 误差 不 大 于 1% 的 概率 为 0.9 所 需 的 
模拟 次 数 ; 

(3) 求 使 得 真 值 与 估计 值 的 相对 误差 不 大 于 1% 的 概率 为 0.95 所 需 的 
模拟 次 数 。 


解 : (1) 由 题 得 ， 对 估计 值 的 要 求 为 P[ ||<0.05) =0.9 





可 得 ， ?| 又 | -0. 95， ed 95) =1.645 


9 
N 
Ey 





(2) 类 似 地 ， 可 求 使 得 真 值 与 估计 值 的 相对 误差 不 大 于 1% 的 概率 为 
0. 9 所 需 的 模拟 次 数 为 : 
_11.645、/ or 
(| 
(3) 使 得 真 值 与 估计 值 的 相对 误差 不 大 于 1% 的 概率 为 0.95 所 需 的 模 
拟 次 数 为 ， 
1.96、 or、 
"= (5071) (各 
【 例 13 -14】 在 一 个 繁忙 的 交通 路 口 ， 有 大 量 汽车 经 过 。 设 每 辆 车 在 
一 天 的 某 段 时 间 内 出 事故 的 概率 为 0.001。 某 交通 部 门 希望 每 天 该 路 口 出 事 


故 次 数 小 于 等 于 2 的 概率 为 0.95， 那 么 每 天 在 这 个 时 间 段 内 该 路 段 限 车 辆 
数 为 多 少 ? 





1， 第 i 辆 汽车 发 生 事 故 
0， 第 i 辆 汽车 没 发 生 事故 ” 
E(X.) =0.001, Var(X,) =0.001 x0.999 


解 : 令 X=| 则 


Li A 
n 0. O001 x0.999/n 
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若 要 满足 P( 立 X < 2) = 0.95 ， 则 


P( DE <2)=P( 2 X/n <2/n) 


DX/n -0.001 2 _ 0.001 
z=1 n 








所 一 一 -一 -一 
V0.001 x0.999/n V0.001 x0.999/n 
2 








一 一 0.001 
所 以 ， =1.645， 可 得 出 m = 662。 所 以 交通 部 门 在 此 时 间 
V0. 001 x0. 999/n 
段 应 限量 通行 汽车 662 辆 。 


在 随机 模拟 中 ， 常 采用 方差 缩减 技术 (Variance Reduction Techniques ) 
来 提高 随机 模拟 的 效率 。 该 方法 利用 已 知 信息 来 减少 在 给 定 精度 下 需要 的 
样本 容量 ,或 对 给 定 的 样本 容量 提高 估计 精度 。 


$13.5 Bootstrap 模拟 


13.5.1 引言 

我 们 考虑 一 个 问题 : 假设 随机 变量 X，X,,…,X, 是 独立 同 分 布 于 
F(x) ， 且 已 知 一 组 样本 观测 值 xm ,x,，,… ,x, 和 函数 g(x， x,，…, x,)。 如 何 
计算 Var(g(X,, X,, …, X,))? 

如 果 分 布 函数 F(x) 已 知 ， 这 个 问题 容易 解决 。 一 方面 可 以 利用 分 布 函 
数 直 接 计 算 Var(g(X,, X,,…,X,) ) 的 值 。 另 一 方面 ， 只 要 能 产生 服从 分 布 
F(x) 的 充分 多 的 随机 数 ， 再 将 这 些 模拟 数 代 和 人 函数 g& 中 ， 可 得 与 Y=g(X,， 
蕊 ,… ,三 ) 同 分 布 的 充分 多 的 随机 数 ， 则 理论 上 就 能 得 到 了 的 分 布 F,(y) 
的 任何 信息 ， 从 而 得 到 Var( 了 ) 的 估计 值 。 如 果 函 数 P(x) 的 具体 形式 未 知 ， 
则 了 的 分 布 米 知 。 车 有 几 组 模拟 秤 术 (wy 2》 (Wy Ws o 
x ) 共 mn 个， 那么 对 于 每 个 模拟 样本 都 可 以 产生 具体 的 y， 生 成 7 ，…y,， 
计算 其 样本 方差 ， 则 可 以 得 到 Var(g(X,, X,,… ,X,)) 的 近似 估计 值 。 

实际 中 ， 很 难 获得 多 组 观测 样本 ,往往 只 有 一 组 样本 观测 值 x,，x,， 
…,x,， 因 此 能 计算 一 个 g(x, *,，-…, %,) 的 值 ， 无 法 计算 Var(g(X,, XX,， 
…, X,) )。 在 只 有 一 组 样本 和 对 总 体 信息 一 无 所 知 的 情况 下 ， 自 助 法 能 产 
生 多 组 模拟 样本 ， 给 出 各 种 样本 统计 量 的 均值 和 方差 一 个 较 好 的 估计 。 


13. 5.2 ”Bootstrap 模拟 的 思想 


EE I em pt 


尽管 分 布 函数 F(x) 未 知 ， 但 是 当 我 们 观测 到 n 个 数据 点 后 ， 很 容易 判 


断 此 分 布 看 起 来 像 什 么 分 布 。 由 Glivenko-cantelli 定理 知 ， 当 nm 一 o ， 经 验 
分 布 fF,(x) 以 概率 1 收敛 到 真实 分 布 F(x)。 故 当 n 充分 大 时 ，F,(x) 应 当 
接近 于 F(x)。 因 此 可 以 认为 ，F,(x) 是 随机 变量 对 的 近似 分 布 孙 数 。 从 而 
在 一 定 意 义 下 ， 

Yarr (Bg(X, *%, KX,)) =E, (ge(X,, *, XK) -Er (el(X,, ,XX,)) 

可 以 作为 Var(g(X,, 鲜 ,，…,《,) ) 的 近似 ， 这 里 EE,, ，Farr 表示 期 望 依赖 于 
经 验 分 布 F,(x) 。 这 个 式 子 中 的 所 应 当 理 解 为 相互 独立 ， 且 分 布 同 F。 

要 计算 Yarr, (g(XX，…, 发 ,) ) ， 需 要 对 经 验 分 布 抽取 所 有 可 能 的 样本 ， 
求 出 g(x;, x,;，… ,Xi,)， 然 后 得 到 样本 估计 量 的 样本 方差 。 对 于 一 个 等 概 
率 nn 点 离散 分 布 ,， 即 P(X=x) =1/n, i=1,2,.…,n,Vare (ge(X, …, X,)) 
的 求解 有 两 种 方法 : 

(1) 当 nn 比较 小 时 ，Vars,(g(X，… ,XX,) ) 常 常 是 可 以 得 到 精确 值 的 。 
因为 若 关 ,， 针 ,,… ,XX, 是 独立 同 分 布 于 等 概率 n 点 离散 分 布 ， 则 类 似 一 个 将 
导 面 的 仍 子 投掷 二 次 ， 所 有 可 能 的 组 合 有 种， 事实 上 它们 的 联合 分 布 是 
一 个 多 项 分 布 ， 所 以 ， 





Vars, (gCXis 1 X)) -Erle(X,, Xs, «eX) -BE)’] 
和 py A ws i) BE)? 
eC = ws 1 R= 1 ) 
D7 2 本 人 
这 里 = 十 了 eC) 


(2) 当 nn 很 大 时 ，n" 项 求 和 不 方便 。 根据 大 数 定理 ， 对 任意 随机 变量 
对 ， 只 要 能 生成 独立 与 革 同 分 布 的 随机 变量 序列 1&,}， 则 当 m 很 大 时 ， 


E(f(X)) ~ EPAE) 。 这 就 是 所 谓 的 模拟 方法 。 因 为 产生 一 个 服从 经 验 
i=1 


分 布 函数 F, 的 随机 数 相当 于 将 ” 面 的 均匀 骨 子 投掷 一 次 ， 这 是 很 容易 进行 
的 ， 所 以 可 以 做 mn 次 试验 ， 每 次 试验 将 n 面 的 均匀 骨 子 投掷 n 次 ， 假 设 第 ; 
次 试验 的 结果 为 2，，… ,x ， 计 算 y=g(xi，…, wx)。 把 
Var(Y) = — TD (eC, ,ee i) 一 了 了) 
i=1 


m 





7 = Dg, es, ,i) 
i=1 
为 farr (EC ， ,于 ) ) 的 近似 值 ， 也 作为 Var(g (XX ,对 ,，… 于) ) 的 近似 
值 。 
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例如 ， 要 计算 s = 二 二 入 (天 - 总) "的 方差 Var(#)， 其 中 |X| 是 独立 


同 分 布 于 F(x) 的 随机 变量 ， 则 可 做 组 模拟 ， 每 组 模拟 产生 个 FF,(x) 的 
随机 数 ， 每 组 模拟 数 可 以 计算 出 一 个 s 的 观测 值 ， 记 为 ， , 左 ， 


Z 一 
可 得 这 万 个 的 观测 值 的 样本 方差 为 Var(s*) = a 


a 


理论 方差 Var(s ) 。 

这 种 以 x,，x,,… ,x, 为 新 总 体 ，F,《(x) 为 总 体 分 布 ， 进 行 随机 抽样 ， 产 
生 样 本 的 方法 称 为 Bootstrap 法 。 将 m 面 的 仍 子 投掷 ”次 称 为 一 次 试验 ， 产 
生 一 个 自助 样本 ，m 个 自助 样本 相当 于 投 撕 mn 次 。 每 次 试验 的 投 邱 次 数 总 
是 和 原始 观测 值 个 数 相 等 。 由 于 自助 法 是 对 原始 观测 值 做 有 放 回 的 随机 试 
验 ， 所 以 同一 个 观测 值 可 能 多 次 出 现 ， 可 能 会 一 次 也 不 出 现 。 自 助 法 依赖 
于 原始 观测 值 ， 原 始 观 测 值 不 同 ， 相 当 于 角 子 不 同 。 

值得 注意 的 是 ， 自 助 法 实际 上 是 对 有 限 离散 分 布 的 模拟 ， 它 是 在 原始 
样本 的 基础 上 继续 模拟 样本 得 到 的 ， 并 没有 考虑 到 总 体 的 所 有 的 观测 值 。 
这 样 求 出 的 方差 只 能 是 Ver(g (处 ,，X,，… ,XX,) ) 的 近似 值 。 

【 例 13 15】 假设 随机 变量 XX ，X,，X, 是 独立 且 同 分 布 于 F(x)， 如 


3 
Dx xz) 


果 用 样本 方差 5 作为 总 体 方差 o 的 估计 ， 即 ”= 。 假 设 有 一 


个 样本 原始 观测 值 为 1，2，3 ， 则 样本 方差 的 观 册 测 值 为 了 ， 估计 Yar(c ) 。 


解 : 如 果 需 要 评价 统计 量 6 的 估计 好 坏 ， 在 没有 其 他 信息 时 ， 这 是 无 
法 进行 的 ， 但 自助 法 可 以 给 出 一 个 数值 估计 。 

如 果 对 原始 数据 进行 3 次 模拟 ， 假 设 结果 为 11, 2, 31 ,11, 2, 2},1{1， 
3, 3} ， 其 对 应 的 方差 为 : 2/3 ，2/9，8/9 ， 所 以 这 3 个 数 可 以 得 到 一 个 均 
值 为 16/27， 相 应 的 波动 为 : 


16 2 6 fs 6 36, 
3 |(§ | [5 37] [3 | 729 


这 个 结果 可 以 作为 o? 的 估计 量 6° 的 波动 性 能 指标 值 ， 即 Var(o) 的 近 
似 估计 和 值 。 

总 的 来 说 ， 自 助 法 的 基本 思想 是 : (1) 经 验 分 布 渐 近 原 分 布 ， 所 以 来 
自 经验 分 布 的 统计 量 可 以 近似 来 自 原 分 布 的 统计 量 。 (2) 只 要 能 从 分 布 中 
生成 足够 多 的 模拟 数 ， 则 随机 模拟 可 以 充分 描述 分 布 的 任何 信息 。 (3) 经 
验 分 布 是 有 限 总 体 的 离散 分 布 ， 易 于 进行 随机 模拟 。 所 以 自助 法 是 原始 观 
测 值 做 有 放 回 的 随机 试验 ， 用 试验 产生 的 多 组 数据 估计 想 要 的 方差 或 其 他 
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的 量 。 其 中 包含 了 两 步 近似 , 一 是 随机 模拟 近似 经 验 分 布 的 概率 性 质 ， 二 
是 经 验 分 布 渐 近 原 分 布 ， 所 以 自助 法 的 精度 既 和 模拟 次 数 有 关 ， 也 和 原始 
观测 值 个 数 有 关 。 


13. 5.3 Bootstrap 计算 均 方 误差 
假设 随机 变量 ，X,,… ,X, 是 独立 同 分 布 F(x) ，6(E) 是 分 布 F(x) 的 


参数 ,假设 9(F) 的 一 个 估计 量 为 6=g(X,, XX,，…, XX,)， 为 了 判别 估计 量 
的 好 坏 ， 采 用 均 方 误差 作为 判别 标准 ， 即 
MSE(F.) =E,.[ (g(X,, X,, *…, X,.) -0(F,))] 
= Var,(g(X,, X,, *…, KX.)) +[Bias(g(X,, X,, -…, X,))] 

其 中 Bias(g(X,, XX,, -…, 了,)) =0--Eige(X,, XX,，… ,XX,)，EF; 表示 期 望 依赖 
于 分 布 F(x)。 

如 果 8( 和， 天) 是 6(F) 的 无 偏 估计 ， 则 MSE(FF) = Var,(g(X， 
了 , ，…… ,大 ,) ) 。 如 果 g( 针 ,，X,，… ,了 XY,) 不 是 9(F) 的 无 偏 估计 ， 则 





MSE(F) =E,[ (g(xX,, 5 …, XX,) -0(F))'] 
当 F(x) 未 知 或 是 很 复杂 时 ， 理 论 上 MSE( 下 ) 无 法 得 到 。 这 时 可 用 
MSE(F.) = E, [ (gC(X,, X,, … ,了 ,) — 6(F.))’] 
写 Dp, 2, (Bx, Xi Xi ) -0(F.)) 
P(X, = %,, ,KX, = x;) 
y 上 (ECxi ， 和 证 ,Xi ) — 0(F.)) 
= De - 


或 者 自助 法 产生 模拟 样本 xi,… ,x,，1 <i<m， 计 算 


MSE(F,) ~ TY (el, xs, ,#1) -0(F,))? 


作为 MSE(F) 的 近似 。 后 者 称 为 均 方 误差 MKSE(zE) 的 自助 法 近似 值 。 
【 例 13 -46】 假设 随机 变量 X,，X,，X, 是 独立 同 分 布 r(x)， 如 果 用 


(x 一 无) 
样本 方差 作为 总 体 方差 e* 的 估计 ， 即 6 = 
原始 观测 值 为 1，2，3， 要 求 : 

(1) 求 MSE(F,); 

(2) 如 果 对 原始 数据 进行 3 次 模拟 ,假设 结 果 为 {1, 2, 31, 11, 2, 2}， 
{1, 3, 31 ， 运 用 自助 方法 ， 计 算 均 方 误差 的 自助 法 近似 值 。 

解 : 
(1) 由 于 只 有 3 个 观测 值 ， 需 要 做 3: 次 试验 ， 每 次 试验 将 3 面 的 均匀 
骨 子 投掷 3 次 ， 得 到 结果 如 下 : 即 以 1/27 的 概率 得 到 1(1, 1, 1)、(2, 2， 


。 假设 有 一 个 样本 
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2)、(3, 3, 3)} ， 模 拟 样本 方差 依次 为 10, 0, 01; 以 179 的 概率 得 到 | (1， 
2 (1, JS (2 ， 2, 3)、 (2 人 2 1)、 (3, 3， 1)、 (3,3,2)}, 模拟 样 


本 方差 依次 为 ee ca 以 子 的 概率 得 到 { (1 ， 本 


vi 
差 为 。 


MSE(F.,) 





上 


(2) 这 3 个 自助 样本 {1, 2, 31，!f1 2, 2} ,，{1, 3, 31| 的 方差 依次 为 
2/3, 2/9, 8/9。 . 





MSE(F,) ~ 5 (eC, ee 
-3[( 子 - 引 ) +( 委 -3 针 +( 主 -3)] 
20 
a 荐 


读者 可 比较 例 13 -16 与 例 13 -15 的 区 别 。 
【 例 13 -17】 假设 随机 变量 天， ,… ,XX 是 独立 同 分 布 F(x)， 现 有 
它们 的 一 组 观测 值 : 8.0、5.1、2.2、8.6、4.5、5.6、8.1、6.4、3.3、 
7.3、8.0、4.0、6.5、6.3、9.1。 下 面 是 被 模拟 的 经 验 分 布 的 自助 样本 ， 
每 个 样本 有 15 个 数据 : 
样本 1: 3.3、3.3、3.3、4.0、4.0、4.0、6.5、7.3、8.1、8.6、8.8、 
9.1、 9.1、 9.1、9.1 
样本 2: 3.3、3.3、5.1、5.1、5.1、5.6、6.4、6.5、6.5、7.3、7.3、 
8.0、8.0、8.0、8.1 
样本 3: 2.2、3.3、3.3、4.0、4.5、4.5、5.1、6.5、7.3、8.0、8.1、 
8.1、8.1、9.1、9.1 


(1) 假设 用 样本 均值 估计 分 布 的 均值 6， 使 用 这 三 个 自助 样本 来 估 
计 天 的 MMS; 


(2) 若是 样本 方差 ,2 是 经 验 分 布 的 方差 , 求 a -2; 
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#| 民 六 三 


5 
(3) 假设 9=F(5)， 如 果 用 68= 15 使 用 这 3 个 自助 样本 来 估 


计 6 的 MSFE。 
解 : . 
(1) 因为 6(F,) = E,(X) 
=(8.0+5.1+2.2+8.6+4.5+5.6+8.1+6.4+3.3 +7.3+8.0 +4.0+ 
6.5 +6.3 +9.1)/15 =6.2 


而 3 个 自助 样本 的 样本 均值 分 别 是 : 6.51，6.24，6.08。 所 以 MSE( 下 ) 的 
自助 法 近似 值 为 : 
3[(6.51 -6.20)* +(6.24 -6.20)* + (6.08 -6.20)*] =0.037 
(2) 样本 方差 是 : 
TS 二 1 ER 
Ss = 14[ 2 -15( #5)"] 
过- 2 
= 订 [535. 92 15(6.2)’] = 4.237 
经 验 分 布 的 方差 是 : 
生起 Ee | a 14 ， 
Vars, [X] = 2 -x*) = 1sl 之 = -15(x)|= 155's = 3.955 
1402 lo 
行 95 源 3 =0.28 
(3) 因为 6(f) = Ff(5)， 用 经 验 分 布 替换 F(x) ， 得 
全 #1i: x <51 
oO(F,.)=F,( i 
#1 (8.0, 5.1, 2.2, 8.6,4.5, 5.6, 8.1, 6.4, 


3.3, 7.3, 8.0, 4.0,6.5, 6.3, 9.1)<5} 
15 


a—-b=S,— 





=0. 267 
又 因为 对 于 自助 样本 有 


Olx!, E20 ”9 x!) 
=#{ (3.3,3.3,3.3,4.0,4.0,4.0,6.5,7.3,8.1,8.6,8.8,9.1,9.1, 
6 


9.1,9.1) <51/15 = 一 =0.4 
,9. 1) <51/ 1 


分 2 2 2 
0(xi, Xay， xn ) 一 
py | 3 3 
DC X2， 人 必 二 


根据 式 (13. 5.1) 得 : 
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3 
= 0.0178 | 
0 


假设 某 个 函数 h(x) 关于 概率 分 布 x (x) 的 期 望 E,(h(X)) = 
a(x) rl) dx 存在 。 如 果 能 够 生成 服从 7(x) 的 4 个 独立 的 样本 x ,… ,x,， 


根据 大 数 定律 ， 对 充分 大 的 mm， 可 以 取 》 = ee 


的 近似 值 ， 这 便 是 蒙特 卡 罗 模 拟 的 基本 思想 。 前 面 已 经 介绍 了 线性 同 余 法 、 
反 钼 数 法 、 取 合法 等 多 种 产生 服从 特定 分 布 的 随机 数 的 方法 。 但 是 这 些 方 
法 只 适用 于 简单 的 分 布 沙 数 ， 如 指数 分 布 、 韦 伯 分 布 等。 在 大 多 数 实际 应 
用 中 ， 人 们 感 兴趣 的 分 布 7 (x) 一 般 高 维 、 复 杂 ， 产 生 独 立 样 本 是 不 可 行 
的 。 通 常情 况 下 ， 产生 的 样本 或 是 相关 的 ， 或 者 产生 的 样本 蜡 于 所 要 求 的 
分 布 7 (x)。 因 此 如 何 产 生 服 从 一 个 复杂 、 高 维 的 分 布 7 (x) 的 随机 样本 全 
成 了 非常 重要 的 问题 。 

米 特 罗 波 利 斯 ( Metropolis) 等 人 在 1953 年 最 时 给 出 了 通过 生成 一 个 马 
尔 可 夫 链 来 实现 从 分 布 "(x) 中 采样 (生成 相关 的 样本 ) 这 一 重要 思想 。 
ee 哈 斯 汀 (Hastings〉 将 其 推广 到 更 一 般 的 形式 ， 其 基本 原理 便 是 建立 
一 个 马尔 可 夫 链 ， 以 7(x) 为 平稳 分 布 ， 从 马尔 可 夫 链 中 抽取 样本 。 这 类 方 
a MCMC 方法 。 

本 节 首 先 给 出 马尔 可 夫 链 的 基本 知识 和 性 质 ， 然 后 说 明 MCMC 的 原 
理 ， 最 后 介绍 两 种 常用 的 MCMC 方法 。 


13.6.1 马尔 可 夫 链 


Sa 了 ssGsmercessaa 


1. 定义 。 假 设 随机 过 程 X, 表示 为 系统 在 时 间 上 的 状态 ， 若 在 元 已 知 的 
条 件 下 ， 系 统 在 将 来 时 刻 了 X,,, 的 状态 (或 某 些 取 值 ) 的 概率 与 过 去 状态 艺 ， 
(s <z) 的 状态 无 关 ， 只 与 过 程 在 1 时 刻 的 状态 有 关 ， 则 称 随 机 过 程 {X,| 为 马 
尔 可 夫 过 程 。 设 S 表示 {X,, t 宇 0 所 处 的 状态 空间 ， 若 5 取 离 散 值 S = {a， 
@，-…| ， 则 称 {X,| 为 马尔 可 夫 链 ,简称 马 氏 链 。 
当 0<t < <t<m, n>0, r>0， 由 马 氏 链 的 定义 知 ， 
Pj(m, m+n) =P{X,,, =alX, =a,, X, =a;, "XX, =a,, FX, =a 


=P|X,,, =alX, =a,) (13. 6.1) 


其 中 ai ES， l1<ke<n, 则 称 P;(m， m+n) = PiX,,, =a;1X, =a| 为 随机 过 
程 匀 ,在 时 刻 m 处 于 状态 ac; 的 条 件 下 ， 在 时 刻 m +n 转移 到 状态 a 的 转移 概 
率 。 显 然 有 
Np 2 
当 一 个 马 氏 链 的 转移 概率 Pj(m, m+n) 只 与 i, 7 及 时 间 间 隔 nn 有 关 时 ， 即 
P(m, m+n) =P(X,,,=alX,. =a,) =P(X, =wlX =0a,) 人 会 P,(n), 
称 转移 概率 具有 时 间 齐 次 性 ， 这 时 马 氏 链 称 为 齐 次 马 氏 链 。P(n) = (P， 


(n) ) 为 于 步 转移 概率 矩阵 。 一 步 转移 矩阵 P(1) 简 记 为 已 用 如 下 的 矩阵 表 
示 : 


Pi 2 a 

P, Pa : P, 
P(1) =(P,) = 

P, P。 -: P, 


容易 证 明 ， 齐 次 马 氏 链 的 转移 矩阵 满足 下 面 的 Chapman-Kolmogorov 方程 : 
Pj(m+n) = DPi(m)P,(n) 


> Pil(n)Py(m) 


大 


因此 ,，P(k) =P…P=P'。 

2. 遍历 性 马 氏 链 及 平稳 概率 。 假 设 |ro(i} 为 马 氏 链 的 初始 分 布 ， 即 
To(i) = 已 |1XK =al, oeSo 记 T= 《7T(1),…7T.(n),…)' 为 XX 的 分 
布 ， 则 

Tr, (zi) = 2 PX = al X, = a)P(X, = a,) = 2 TP, 


(13. 6.2) 
从 而 
T=TP=7 LP: P=.… = TP 
车 马 氏 链 经 过 相当 长 的 一 段 运 行 时 间 过 程 处 于 状态 的 时 间 的 比例 
(Bh 7 (7) = lmP(X, =j) ) 只 与 状态 有 关 ， 而 不 论 初始 分 布 如 何 ， 则 马 氏 
链 存 在 极限 分 布 ， 记 {7。(i)|} 为 极限 分 布 。 若 极限 分 布 存 在 ， 则 对 式 
(13. 6.2) 两 边 取 极 限 有 : 


T。() = 》 TCiP,, j=1,2,. 
| (13. 6.3) 


p> 7T.(i) =1 
车 马 氏 链 的 分 布 族 和 7,, t 宇 0 满足 7,,(i) =T(i)，VaieS,， tiz0， 则 
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称 马 氏 链 是 平稳 马 氏 链 。 注 意 到 mri = zsP， 因 此 若 zi 满足 
PY (13. 6. 4) 
则 马 氏 链 是 平稳 马 氏 链 ，7。 称 为 平稳 分 布 。 因 此 ， 如 果 马 氏 链 的 极限 分 布 
存在 ， 则 7 就 是 马 氏 链 的 平稳 分 布 。 显 然 ， 不管 初始 状态 X, 是 什么 分 布 ， 
在 经 过 一 段 时 间 后 , 和 的 边际 分 布 就 都 是 平稳 分 布 7。。 
如 果 对 于 每 一 对 状态 a, 和 ww， 马 氏 链 从 状态 a, 经 过 有 限 步 后 转移 到 状 
态 a 的 概率 大 于 0， 即 存在 ”=1，Py >0， 则 称 这 样 的 马 氏 链 是 不 可 约 的 。 
对 于 不 可 约 的 马 氏 链 ， 如 果 对 某 个 n 宇 0 和 某 个 状态 c 有 
P(X,=jIX, =j) >0 和 P(X,,, =jIlX, =j) >0 
则 称 这 个 不 可 约 的 马 氏 链 是 遍历 的 。 
对 于 遍历 的 马 氏 链 ， 可 以 证 明 极 限 分 布 存 在 有 旦 唯一， 转移 概率 具有 极 
限 分 布 >。 ， 即 limP,(n) =7。(j) (不 依赖 i)。 
具有 遍历 性 的 马 氏 链 的 一 个 重要 性 质 是 对 于 状态 空间 中 的 任意 函数 


im 二 了 HKX) = Bn. (0) (13. 6.5) 


以 概率 1 成 立 。 

遍历 马 氏 链 的 充 要 条 件 不 容易 验证 ， 这 里 给 出 一 个 充分 条 件 : 

车 齐 次 马 氏 链 {X,, n 宇 0| 的 状态 空间 为 $= |a,, a,, …,ar| ， 存 在 正 整 
数 m， 使 对 任意 的 a,，a,e S, 都 有 Py(m) >0, i,j=1,2,…, N， 则 马 氏 
链 具有 遍历 性 。 


n+l 


13.6.2 MCMC 基本 原理 

现在 想 要 生成 具有 概率 分 布 P(X=j) =7(j) ,j=1, …, WN 的 随机 变量 
改 的 随机 数 。 如 果 能 够 生成 一 个 具有 极限 概率 17r(7) ,j=1,…N1| 的 遍历 马 
氏 链 {对 | ， 则 根据 遍历 马 氏 链 的 性 质 ， 不 管 初始 状态 X, 是 什么 分 布 ， 在 经 
过 一 段 时 间 后 ，{X,} 的 边际 分 布 近似 于 极限 分 布 7。 因此 我 们 通过 运行 该 
马 氏 链 n 步 (n 足够 大 ) ， 来 获得 X, 的 值 ， 并 将 这 个 值 近似 的 作为 想 要 生 
成 的 随机 变量 随机 数 。 另 外 ， 如 果 是 为 了 能 够 估计 E,(h(X)) = 


台 h(j)7() ， 可 选取 马 氏 链 中 的 值 X，…,X,， 可 以 使 用 佑 计量 上 允 h(X,) 


来 估计 E,(h(X))， 即 二 了 h(%) 一 ,(h(X)) 。 然 而 ， 由 于 初始 状态 的 先 


取 对 前 期 的 马 氏 链 的 状态 有 很 强 的 影响 ， 一 般 在 应 用 中 适当 的 选取 某 个 
然后 舍 去 前 上 个 状态 ， 也 就 是 说 ， 使 用 估计 量 部 h(X,) 。 至 于 大 的 精 


n 


确 选取 ，Aarts 和 Korst 给 出 了 一 些 结果 @。 一 般 情 况 下 ， 可 以 用 直观 给 出 的 
值 (通常 来 说 这 样 做 会 有 比较 好 的 效果 ， 因 为 无 论 取 什么 样 的 值 都 能 够 有 
很 好 的 收敛 ) 。 

MCMC 的 一 个 关键 问题 是 如 何 构 造 一 个 极限 分 布 为 {7()) ,j=1,…， 
Ni 的 遍历 马 氏 链 。 这 里 介绍 两 种 比较 流行 的 方法 。 


13. 6.3 Metropolis-Hastings 抽样 

对 于 任意 给 定 的 概率 分 布 |7(x), x =1, :…,N}， Metropolis - Hastings 
方法 描述 了 一 个 马 氏 链 的 转移 准则 ， 使 得 其 稳定 分 布 为 zr(x)。 

设 Q 是 个 状态 空间 为 整数 11, …，, N1 的 不 可 约 的 转移 概率 和 矩阵， 其 第 x 
行 第 y 列 元 素 为 a(x, 7y) ， 隆 数 a(x, 7Y) 满 足 0<al(x, 7y) <1, x, ye {1,-…， 
Ni 。 对 于 任 一 组 合 (x, y) ， 定 义 : 

p(x,y) = g(x, y)a(x, y) xz 天 了 


PCxz，x) =1-— falx, y)a(x, y)dy X= 


则 易 见 p(x, 7y) 构 成 一 个 概率 转移 矩阵。 

此 方法 的 实施 比较 直观 : 如 果 构 造 的 马 氏 链 在 时 刻 t 处 于 状态 x， 即 XX, = 
x， 则 首先 由 gq( Ix) 产生 一 个 潜在 的 转移 x 一 Yy， 然 后 以 a(x, 7) 的 概率 接受 
y 作为 马 氏 链 的 下 一 时 刻 的 状态 值 ， 即 X,,, =y; 而 以 概率 1 -al(x, 7Y) 拒 绝 转 
移 到 y， 从 而 马 氏 链 在 下 一 时 刻 仍 处 于 状态 *， 蕊 ,， = x。 


如 果 选 取 
a(xz，y) = min{ 1 ， YY | (13. 6.6) 
此 时 有 
q(x, y), T(Y)q(y, x*) 17x) g(x, y) 





plx, y) 区 OA WY)q(y, x) <mT(x)q(x, y) 


T(x) 

可 证 明 由 上 述 过 程 产生 的 马 氏 链 是 时 间 可 逆 的 ,由 7(x)p(x, y) =7T(y)p 
(y, x)， 县 zx(x) 是 马 氏 链 的 平稳 分 布 。 | 

下 面 总 结 上 述 用 于 生成 zx(*) 为 平稳 分 布 的 时 间 可 逆 马 氏 链 的 Metropo- 
lis - Hastings 算法 。 

(1) 选择 一 个 转移 概率 为 a(x, 7y), x, y=1,… ,NN 的 不 可 约 马 氏 转 移 
矩 阵 ， 并 选择 某 个 1 到 WN 的 整数 x; 

(2) 令 n=0, X=x; 

(3) 生成 一 个 随机 变量 天 的 随机 数 使 得 P(X,=7y) =gq(X,, 7Y); 





DD Aarts and Korst, Simulated Annealing and Bolltzmann Machines, Wiley, New Yok, 1989. 
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(4) 生成 一 个 在 0 到 1 间 均 匀 分 布 的 随机 数 5,， 若 也 小 于 等 于 a(x， 
y) ， 则 NS = 天,， 若 了 大 于 a(Cx，y)， 则 NS = 大; 

(5) n=n+l1, X,=NS 

(6) 转 到 第 (3) 步 。 


13.6.4 吉 布 斯 抽样 

应 用 最 广泛 的 Metropolis - Hastings 方法 是 吉 布 斯 抽样 。 设 随机 向 量 无 
= (XX ，… ,不 ,) 的 概率 分 布 泪 数 为 p(x)， 其 中 p(x) 仅 需 确 定 一 个 乘积 常 
数 ， 即 

p(x) =cg( x) (13.6.7) 

其 中 gg(x) 已 知 ， 而 < 未 知 。 

对 状态 x = (x,，…, x,) 的 马 氏 链 应 用 Metropolis - Hastings 算法 ， 其 转 
移 概 率 定义 如 下 : 如 果 当 前 状态 为 x， 从 1,…,n 中 等 可 能 的 选取 一 个 坐标 。 
如 果 选 取 坐 标 i， 则 可 生成 一 个 随机 变量 处 ， 其 概率 分 布 隆 数 为 分 量 ,关于 
其 他 分 量 的 条 件 分 布 ， 即 


P(X=x) =P(X,=xIX, =%, jz#i) (13.6.8) 
且 如 果 针 =x， 则 y= (x,， “XC, Xl, …,%,) 为 下 一 个 坐标 。 换 句 话说 ， 已 
知 x 和 y， 吉 布 斯 抽样 利用 Metropolis-Hastings 算法 ， 有 


p(y) 
np(X, 三 和 ij， ji) 
由 于 极限 分 布 为 p， 根据 式 (13. 6.6)， 向 量 y 作为 新 状态 的 概率 为 : 


p(y)aq(y, x) 1) = min( £0 2 1) = 
p(x)q(x, y)” PCX)P(y)” 


因此 ， 利 用 吉 布 斯 抽样 得 到 的 坐标 总 可 以 作为 马 氏 链 的 下 一 步 状态 。 
吉 布 斯 抽样 具体 步骤 可 如 下 进行 : 在 给 出 起 始点 x = (xz ，…, x 人)， 
假定 已 知 第 上 +1 次 抽样 开始 时 的 观测 值 为 x2 = (x ,，…，xo)， 则 第 上 +1 





1 - 
q(x, y) = P(X =xlX, =%, jzi) = 


a(x, y) =min( 


次 抽样 的 具体 步骤 如 下 : 
。 由 条 件 分 布 交 (zx ，… ,xW) 抽 取 x 人 ; 
由 条 件 分 布 T(xilxt | ett) 9 we ， 9 x ) 抽 取 we; 


。 由 后 验 分 布 7(x,lm”，…, xo ) 抽 取 x 。 
记 x = (区 (1 ,x ) ， 最 终 得 到 x ,x ee ,XO J i 

由 q(x, y) 的 构造 知 ，@ 是 一 个 不 可 约 的 转移 矩阵 。 因 此 马 氏 链 是 遍历 
性 的 。 由 不 同 x 中 出 发 ， 当 二 时， 可 以 认为 各 时 刻 x 的 边际 分 布 为 极限 
分 布 ， 此 时 它 收敛 。 而 在 收敛 出 现 前 的 mm 次 迭代 中 ,各 状态 的 边际 分 布 还 
不 能 认为 是 "(x) ， 因 此 在 估计 E,(h(X) ) 时 应 将 前 m 个 迭代 值 去 掉 ， 即 : 
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hs) ECh(X)) 


在 贝 叶 斯 理论 中 ， 未 知 参 数 的 后 验 分 布 大 多 是 多 维 的 、 复 杂 的 分 布 孙 
数 ， 计 算 与 后 验 分 布 有 关 的 概率 或 函数 期 望 往往 很 困难 ， 这 时 可 应 用 吉 布 
斯 抽样 来 解决 。 假 设 针 ,XX,,… ,XX, 独立 ,分布 参 数 为 9，9 未 知 。 给 定 @ =6 


时 ，X, 的 分 布 为 As(z16)， 则 无 = (XX, XX,，…, 于 ,) 的 条 件 分 布 密度 为 
[l/s 6) 。 设 9 的 分 布 密 度 为 +(@)， 在 贝 叶 斯 估计 中 ， 在 已 知 革 = 六 








条 件 下 ，@ =(9,,，…, @.) 的 后 验 分 布 为 : 
太 .。( 王 ， 0) 
| XT) = 一 一 一 一 一 = 2 上 
Telz(O 元) 所 (x) es ) ( 0)7(0)) 
(13. 6.9) 


显然 ， 后 验 分 布 满足 吉 布 斯 抽样 所 要 求 的 分 布 形 式 (13.6.7)， 因 此 可 用 
吉 布 斯 抽样 来 解决 有 关 后 验 分 布 的 计算 问题 。 下 面 是 一 个 具体 的 例子 。 
【 例 13 -18】 设 Ni) 为 一 个 棒球 赛季 前 1004% 的 赛程 中 球员 A 本 
人 垒 打 的 次 数 ，0 友 上 和 1。 类 似 地 ， 设 N,(t) 为 球员 B 的 本 人 垒 打 次 数 。 
设 存 在 随机 变量 到 和 WW,， 满 足 在 给 定 W, =w,,，W,=w, 下 ,1{N,(z:)， 
0 三 上 反 1} 和 {fN (ti ,0 三 大 1} 为 独立 泊 松 过 程 ， 且 参数 分 别 为 w 和 zw。 此 
外 ， 设 肌 | 和 多 是 参数 为 卫 的 独立 指数 随机 变量 ， 且 了 自身 为 (0. 02， 
0. 10) 上 均匀 分 布 的 随机 变量 。 换 言 之 ， 假 设 球 员 击 出 本 人 垒 打 的 次 数 服 从 
一 个 参数 为 随机 变量 的 泊 松 过 程 ， 生 这 一 随机 变量 的 分 布 的 参数 本 身 服从 
已 知 分 布 。 
假设 在 前 半 赛 季 A 击 出 25 次 本 人 垒 打 ，B 击 出 18 次 。 根 据 吉 布 斯 抽样 
来 估计 他 们 个 人 在 全 赛季 分 别 击 出 的 本 艰 打 均值 。 
解 : 由 题 知 ， 存 在 随机 变量 YY、 和 WW 满足 : 
(1) 了 服从 (0.02，0.10) 上 均匀 分 布 ; 
(2) 给 定 了 Y=y，W 和 丈 , 是 参数 为 y 的 独立 同 分 布 的 指数 随机 变量 ; 
(3) 给 定 WW=w, W,=w,，{N(t), 0 三友 11 和 1{fN() ，0 三 上 和 11 为 
独立 泊 松 过 程 ， 且 参数 分 别 为 w 和 w,。 
为 求 E[N,(1)1N.(0.5) =25, N,(0.5) =18]j]， 首 先 加 上 WW, 的 条 件 : 
ELN,(1)1IN.(0.5) =25, N,(0.5) =18, W,|] =25 +0.S5W, 
求 在 给 定 N,(0.5) =25 和 NN,(0.5) =18 下 的 条 件 概率 ， 得 
E[N,(1) IN,(0.5) =25, N,(0.5) =18] 
=25 +0.5E[W,IN,(0.5) =25, N,(0.5) =18] 





@ 本 节 两 个 例子 来 自 罗斯 (Sheldo M. Ross) 著 、 王 兆 军 等 译 :《 统 计 模 拟 》( 第 4 版 )， 人 民 邮 电 出 版 
社 2007 年 版 ， 第 214 页 。 
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类 似 地 ， 有 

EL N,(1)1N,(0.5) =25, N,(0.5) =18] 

=18 +0.5E[ W,IN,(0.5) =25, N,(0.5) =18] 
现 利 用 吉 布 斯 抽样 估计 这 些 条 件 期 望 。 首 先 ， 对 于 0.02 <y<0.10, w, >0， 
w,>0， 有 

fly, w,, w,, Ni(0.5) =25, N,(0.5) =18) 

=Cye Ye mw, )”(w,)" 
其 中 C 不 依赖 于 y，w,;，w,;,。 因 此 ， 对 于 0.02 <y<0.10， 有 

flylw, ws, Ni(0.5) =25, N,(0.5) =18) = Cye ™™) 
上 式 说 明 给 定 w!，w,，N,(0.5) =25, N,(0.5) =18 下 了 的 条 件 分 布 为 参数 
为 3 和 zw +w, 的 伽 玛 随机 变量 在 0. 02 到 0. 10 间 取 值 的 条 件 分 布 。 另 外 ， 

fly, ws, Ni(0.5) =25, N,(0.5) =18) = Ce ot (ww )” 
由 此 可 知 ， 在 给 定 y，w,，N,(0.5) =25, N,(0.5) =18 下 W, 的 条 件 分 布 是 
参数 为 26 和 y+0.5 的 伽 玛 分 布 。 同 理 ， 在 给 定 y, wl,, N,(0.5) =25, WN, 
(0.5) =18 下 W, 的 条 件 分 布 是 参数 为 19 和 y+0.5 的 伽 玛 分 布 。 

于 是 ， 从 y，w,，w; 的 值 开 始 ， 其 中 0.02 <y<0.10， 且 ww>0， 吉 布 
斯 抽样 如 下 进行 : 

(1) 产生 一 个 值 在 0.02 与 0.10 之 间 的 参数 为 3 和 zw +w, 的 伽 玛 随 机 
变量 的 值 ， 并 令 其 为 新 的 y 值 ; 

(2) 产生 参数 为 26 和 y+0.5 的 一 个 伽 玛 随机 变量 的 值 ， 并 令 其 为 新 
的 zw; 

(3) 产生 参数 为 19 和 y+0.5 的 一 个 伽 玛 随机 变量 的 值 ， 并 令 甚 为 新 
的 w,; 

(4) 回 到 步骤 (1)。 

w, 的 平均 值 即 为 E[ WW,1N,(0.5) =25，,，N,(0.5) =18] 的 估计 ，w, 的 平 
均值 即 为 五 [有 :1V (0.5) =25，N (0.5) =18] 的 估计 。 前 者 的 一 半 加 上 25 
即 为 我 们 对 A 全 年 击 出 的 本 健 打 的 平均 数 的 估计 ， 后 者 的 一 半 加 上 18 为 也 
击 出 的 本 又 打 的 平均 数 估 计 。 国 

【 例 13 -19】 设 了 ,i=1,2,3, 4,5 为 独立 指数 随机 变量 ， 且 蕊 的 
均值 为 上 ， 使 用 吉 布 斯 抽样 利用 模拟 方法 估计 

B= PfTTx > 120 | SX, = 15} 

解 : 随机 选择 坐标 中 的 两 个 就 可 以 完成 此 项 任务 。 首 先 , 假设 和 Y 

是 参数 分 别 为 4 和 的 独立 指数 随机 变量 ， 其 中 人 <A， 并 且 我 们 按 如 下 方 


法 寻找 在 X+y=a 下 的 站 的 条 件 分 布 : 
rryrCxzla) =C, fry(%, a-%),O0O<x<a 


= Ce ee 0<x<a 

=Ce ,0<x<a 

”此 条 件 分 布 为 一 小 于 a 条 件 下 的 参数 A -人 的 指数 随机 变量 的 条 件 分 布 。 
利用 这 一 结果 ， 通 过 令 初 始 状 态 (x,, x,, x,, %,, %s) 是 和 等 于 15 的 任意 

5 个 正 数 ,我 们 可 以 估计 B。 现 从 1, 2,，3, 4, 5 中 随机 选 出 两 个 数 ; 假设 

挑选 的 两 个 数 为 1=2 和 J =5， 则 在 给 定 其 他 值 下 下 和 区 的 条 件 分 布 为 在 

其 和 等 于 15 -x, x, 一 x 下 两 个 均值 分 别 为 2 和 5 的 独立 指数 随机 变量 的 条 

件 分 布 。 但 是 ， 由 前 所 述 ， 要 获得 XX, 和 X, 的 值 ， 首 先 要 产生 一 个 小 于 

15 ~-x, 一 x; -~x。 且 参 数 为 0.5 -0.2 =0.3 的 指数 随机 变量 的 值 。 之 后 ， 令 x， 


等 于 这 个 值 ， 且 重 设 x; 使 得 导 , x, = 15 。 不 断 重 复 这 一 过 程 , 用 T[X > 
120 的 状态 向 量 * 的 比例 作为 B 的 估计 。 u 


$13.7 精算 寻 术 中 的 卫 机 模拟 实 人 


本 节 以 例题 的 方式 给 出 一 些 模拟 在 精算 模型 中 的 应 用 ， 这 些 内 容 只 是 
在 前 面 模拟 的 基本 方法 中 加 入 保险 的 背景 。 

【 例 13 -20】 假设 索赔 次 数 服从 泊 松 分 布 ， 每 年 索赔 次 数 的 平均 值 为 
1。 索 赔 额 服从 均值 为 10 000， 标 准 差 为 500 的 正 态 分 布 。 根 据 [0, 1] 区 间 
上 均匀 分 布 的 随机 数列 0.4、0. 8 模拟 前 两 年 的 索赔 次 数 ; 根据 [0, 1] 区 间 
上 均匀 分 布 的 随机 数列 0. 1、0. 3 和 0. 5 模拟 每 次 索赔 额 。 保 险 公 司 对 于 每 
年 的 索赔 额 的 免 赔 额 为 5 000。 计 算 这 两 年 内 保险 公司 给 付 总 数 的 一 个 模拟 
结果 。 

解 : 由 于 索赔 次 数 服 从 均 。 表 卫 -7 


值 为 1 的 泊 松 分 布 ， 分 布 函 数 __” 9 ! 2 Ee 
如 表 be Weg 所 示 。 fln) 0.368 | 0. 368 | 0.184 0.061 

若 用 随机 数 0.4 和 0. 8 进行 F(n) | 0.368 | 0.736 0.92 0.981 
模拟 ， 因 为 

F(0) =0. 368 <0.4<F(1) =0.736, F(1) =0.736<0.8 <F(2) =0.92 

根据 反 函 数 原理 可 得 第 一 年 索赔 次 数 为 1， 第 二 年 的 索赔 次 数 为 2， 两 年 内 
索赔 次 数 的 模拟 值 是 3， 所 以 要 模拟 3 个 索赔 额 。 

对 于 索赔 额 根 据 反 函数 法 ， 根 据 [0, 1] 区 间 上 均匀 分 布 的 随机 数列 0. 1、 
0.3 和 0.5 可 以 得 到 标准 正 态 分 布 的 随机 数 QZ 为 -1.282，-0.2544，0。 

损失 三 服从 均值 为 10 000， 标准 差 为 500 的 正 态 分 布 ， 所 以 令 头 = 
10 000 + 500Z， 可 得 模拟 的 损失 随机 数 为 9 359, 9 872.8，10 000。 

根据 保险 公司 对 于 每 年 索赔 人 额 的 免 赔 额 为 5 000， 则 第 一 年 保险 公司 的 
损失 为 9 359， 赔 付 为 4 359， 第 二 年 保险 公司 的 损失 为 19 872.8 ， 赔 付 为 
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14 872.8。 所 以 ， 保 险 公 司 这 两 年 的 总 赔付 为 19 231. 8 。 国 
【 例 13 -21】 假设 索赔 次 数 服从 二 项 分 布 B(4, 0.5) ， 索 赔 强度 服从 
a=2，06=1000 的 帕 累 托 分 布 。 用 均匀 分 布 随 机 数 0.81，0.53 ，0. 68 ， 
0. 12 来 模拟 N， 久 ,，,,… ,赔偿 限额 为 1 000， 根 据 随 机 数 得 到 模拟 值 计 算 
保险 在 第 几 起 损失 发 生 时 完全 不 负 赔 付 责任 。 
解 : 表 13 -8 是 索赔 次 数 N 对 应 的 分 布 列 。 因 此 均匀 随机 数 0.81 对 应 
的 索赔 次 数 为 3。 


表 13 -8 




















幅 累 托 分 布 的 分 布 函 数 F(x) =1 -Fz] =1-(60035] ， 所 以 x= 
1 000 一 _1 000。 那 么 0.53，0.68，0.12 对 应 的 赔付 额 为 458.65， 


767.77，66.0。 因 为 458.65 <1 000 <458. 65 +767.77， 所 以 保险 公司 对 第 
二 起 损失 部 分 赔偿 ， 对 第 三 起 损失 完全 不 负 赔 付 责任 。 加 

【 例 13 -22】 假设 索赔 次 数 服从 Possion (3)， 理赔 额 服 从 均值 为 
1 000 ， 标 准 差 为 600 的 正 态 分 布 。 假 设 初始 盈余 为 1 000， 安 全 附加 系数 6 
为 0.1。 保 费 收 取 在 年 初 ， 当 到 余 为 负 时 保险 公司 则 会 破产 。 从 随机 数 表 选 
出 的 在 [0，1] 区 间 内 的 随机 数 0.23，0. 14，0. 49，0. 34，0. 21 来 模拟 理 
赔 的 时 间 间 隔 ， 用 随机 数 0. 50，0. 17，0. 88 ，0. 62，0.74 来 模拟 赔付 额 。 
求 该 保险 公司 在 何 时 破产 。 

解 : 由 题目 得 : 

期 望 保费 = 期望 索赔 次 数 x 期 望 赔付 额 x (1 +0) 

所 以 ,期望 保费 =3 x1 000 xl.1=3300。 

由 泊 松 分 布 的 性 质 ， 保险 公司 发 生 赔 付 的 时 间 间 隔 服 从 均值 为 1/3 的 
指数 分 布 。 设 模拟 得 到 的 时 间 间 隔 为 :， 则 有 


r,=1 一 e 在 所 -本 In(1 -mn) 


则 模拟 得 到 的 上 依次 为 0.087，0. 0502，0. 2244 ，0. 1385 ，0. 0786 。 

对 于 索赔 额 ， 根 据 反 函数 法 ， 根 据 [0, 1] 区 间 上 均匀 分 布 R 的 随机 数 
列 0.50，0. 17，0. 88 ，0. 62 ，0. 74 可 以 得 到 标准 正 态 分 布 的 随机 数 2Z 为 0， 
-0.9542，1. 1750，0. 3055 ，0. 6433 。 

损失 头 服 从 均值 为 1000， 标准 差 为 200 的 正 态 分 布 ， 所 以 令 瑟 =1 000 + 


200Z， 可 得 模拟 的 损失 随机 数 为 1 000，809.16，1 235, 1 061.1, 1 128. 66。 

下 面 我 们 开始 模拟 保险 公司 的 损益 过 程 : 

。 在 时 刻 0， 保 险 公 司 的 盈余 = 初始 盘 余 + 收 到 的 保费 =3 300 +1 000 = 
4 300; 

。 在 时 刻 0.087， 发 生 第 一 次 索赔 ,保险 公司 此 刻 的 一 余 =4 300 - 
1 000 =3 300; 

。 在 时 刻 0.1372， 发生 第 二 次 索赔 ,保险 公司 此 刻 的 盈余 =3 300 - 
809. 16 =2 490. 84; 

。 在 时 刻 0.3616， 发 生 第 三 次 索赔 ,保险 公司 此 刻 的 叙 余 =2 490. 84 
-1235 =1 255. 84; 

。 在 时 刻 0.5001， 发 生 第 四 次 索赔 ， 保 险 公 司 此 刻 的 盈余 =1 255. 84 
—1 061.1 =194. 74; 

。 在 时 刻 0.5787， 发生 第 五 次 索赔 ,保险 公司 此 刻 的 盈余 =194.74 - 
1 128. 66 <0。 

所 以 保险 公司 在 时 刻 0. 5787 破产 。 本 

在 这 个 模型 中 可 以 看 出 ， 保 险 公 司 每 次 的 索赔 数额 的 离 差 不 大 ， 但 是 
索赔 次 数 一 旦 发 生 多 次 ,保险 公司 便 难 以 承受 。 可 以 建议 保险 公司 提高 安 
全 附加 系数 或 者 购买 责任 超 赔 再 保险 来 保证 公司 的 正常 运营 。 

【 例 13 -23】 假设 索赔 的 时 间 间 隔 服 从 均值 为 1/3 的 指数 分 布 ， 理 
赔 额 蕊 = 10'，: 为 索赔 发 生 的 时 刻 。 保 费 的 收取 为 一 个 连续 的 过 程 ， 收 取 率 
为 20t* 且 i=0。 当 至 余 为 负 时 保险 公司 则 会 破产 。 从 随机 数 表 选 出 的 在 
(0, 1) 区 间 内 的 随机 数 0.5，08，0.9 来 模拟 理赔 的 时 间 间 隔 ， 求 在 已 知情 
况 下 的 初始 的 最 小 资金 需求 来 保证 在 这 三 次 索赔 下 保险 公司 的 正常 运营 。 


解 : 设 模拟 得 到 的 时 间 间 隔 为 m， 则 有 


-3m 


r=1l1-e ",m,= -SIn(1 —7;) 


则 模拟 得 到 的 m 依次 为 0. 231、0. 5365、0.7675。 

根据 理赔 额 耻 =10'，:i 为 索赔 发 生 的 时 刻 ， 模拟 得 到 的 i 依次 为 0. 231、 
0.7675、1.535， 则 依次 得 到 的 耶 依 次 为 1.7022、5. 8546、34. 2768。 

根据 保费 的 收取 率 20: ， 在 时 刻 0.231、0.7675、1.535， 收 到 的 保费 


为 让 207 dt ， 根 据 公 式 可 得 到 在 时 刻 0.231、0. 7675、1. 535 收取 的 保费 依 


次 为 0.0026、1. 06 、34。 
设 初 始 的 最 小 资本 需求 为 c， 那 么 ， 
。 在 时 刻 0.231， 为 了 保证 保险 公司 正常 运营 ，c +0. 0026 -1.7022 >0; 
。 在 时 刻 0.5365 ， 为 了 保证 保险 公司 的 正常 运营 ，c+1.06 -1.7022 
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-5.8546 >0; 

。 在 时 刻 1.535， 为 了 保证 保险 公司 的 正常 运营 , c +34 -1.7022 - 
5. 8546 ~ 34. 2768 >0。 
可 以 得 出 c>7.8336， 即 必须 保证 初始 的 最 小 资金 大 于 7. 8336 才能 使 保险 
在 这 三 次 索赔 发 生 后 能 仍 能 正常 运营 。 加 


se 


1. 根据 [0, 1] 区间. 上 均匀 分 布 的 随机 数列 0.3、0.6875 和 0.95 表示 二 
项 分 布 B(4, 0.5) 的 数 。 

2. 根据 [0, 1] 区 间 上 均匀 分 布 的 随机 数列 0. 1247、0. 9321 和 0. 6873 
来 表示 Possion (3) 的 数 。 

3. 一 个 科学 家 做 实验 ， 成 功率 为 0.6,， 了 表示 到 第 一 次 成 功 的 试验 次 
数 。 根 据 [0, 1] 区间 上 均匀 分 布 尺 的 随机 数列 0.85、0.38、0.63、0.22 来 
模拟 卫 。 计 算 到 第 三 次 成 功 的 试验 次 数 。 

4. 假设 
0. Sx, O<x<1 
0.5+0.25x, 1<x<2 

根据 [0, 1] 区 间 上 均匀 分 布 的 随机 数列 0.3、0.6 和 0.9 模拟 天 的 随机 
数列 。 

5. 随机 变量 天 的 分 布 函 数 Fr(x) 是 两 个 指数 分 布 的 综合 ， 分 布 1 是 均 
值 为 1 的 指数 分 布 ， 权 重 为 0.25; 分 布 2 是 均值 为 2 的 指数 分 布 ， 权 重 为 
0.75。 根 据 [0, 1] 区 间 上 均匀 分 布 的 随机 数 0.7 来 模拟 有。 


F(x) -| 


6. 假设 随机 变量 下 的 样本 均值 为 下 ,方差 为 足 。 通 过 模拟 来 估计 总 体 
均值 ， 求 使 得 真 值 与 估计 值 的 相对 误差 不 大 于 5% 的 概率 为 0.9 所 需 的 模拟 
次 数 。 

7. 假设 通过 模拟 得 到 大 =1,， 大 =2, =3，， =4， 天 ,=5， 为 了 使 
殖 ( 下 ) 估计 值 的 标准 差 不 大 于 0.05 所 需 的 模拟 次 数 。 

8. 设 随 机 变量 下 服从 指数 分 布 。 通 过 模拟 来 估计 总 体 已 (100)。 假 设 
P, 为 样本 中 小 于 100 的 数目 ,于 为 样本 数 。 求 使 得 真 值 与 估计 值 的 相对 误 
差 不 大 于 5% 的 概率 为 0.9 所 需 的 模拟 次 数 。 

9. 存在 一 个 随机 样本 ,样本 的 分 布 涵 数 未 知 ， 已 知 祥 本 标准 差 的 区 间 
为 [2, 3] ， 求 使 得 样本 均值 的 0.9 置信 区 间 不 大 于 1 的 最 小 样本 量 。 

10. 假设 某 个 理赔 员 处 理 一 次 索赔 时 间 为 0.5 个 小 时 或 1 小 时 ,概率 分 
别 为 0.5， 小 的 随机 数 对 应 小 的 处 理 时 间 ， 随 机 数 为 0.1，0.6，0.4; 用 均 


匀 分 布 随机 数 0.2、0.4、1.1 来 表示 索赔 事件 在 某 2 个 小 时 时 间 段 内 发 生 
的 时 间 。 问 该 理赔 员 在 该 时 段 结束 时 处 理 索 赔 的 状态 。 

11. 假设 一 个 健康 险 的 分 布 为 符合 泊 松 分 布 ， 索 赔 次 数 服 从 Possion 

0. Sx ， O<x<1 
(3) ， 每 次 索赔 额 服 从 的 分 布 函数 为 F(x) -| ， 单 位 
0.5 +0.25x, 1 <x<2 

为 万 元 。 根 据 [0, 11 区间. 上 均匀 分 布 R 的 随机 数列 0. 1247、0. 4121 模拟 前 
两 年 的 索赔 次 数 ; 根据 [0, 1] 区 间 上 均匀 分 布 RR 的 随机 数列 0.3、0.6 和 
0.9 模拟 每 次 索赔 额 。 保 险 公 司 对 于 每 年 的 索赔 额 的 免 赔 额 为 5 000 元 。 计 
算 这 两 年 内 保险 公司 给 付 总 数 的 一 个 模拟 结果 。 

12. 假设 索赔 次 数 服 从 二 项 分 布 (n =4, p=0.5)， 索 赔 强 度 服从 均值 为 
1 000 的 指数 分 布 ， 用 均匀 分 布 随机 数 0.21，0.33，0.67，0.13 来 模拟 N， 
和 ， 刀 ,计算 总 赔付 额 。 

13. 假设 一 个 车 险 的 每 月 的 损失 分 布 服从 均值 为 1 000 的 指数 分 布 ， 每 
月 的 免 赔 额 为 300,， 根据 [0, 1] 区间 上 均匀 分 布 尺 的 随机 数列 0.213， 
0. 376 ，0. 754 ，0. 109 模拟 前 四 个 月 的 损失 额 ， 计 算 保 险 公 司 前 四 个 月 的 赔 
付 额 。 

14. 索赔 次 数 服 从 二 项 分 布 (4，0.5)， 赔 付 额 服 从 帕 累 托 分 布 (2.5， 
1 000)。 杠 据 [0, 1] 区间. 上 均匀 分 布 尺 的 随机 数列 0.2，0.8，0.3，0.1， 
0.5，0.6，0.9，0.3 来 模拟 索赔 次 数 和 索赔 额 ， 当 模拟 的 总 索赔 次 数 达 到 
4 时 停止 和 模拟。 计算 保险 公司 的 总 赔付 额 。 

15. 假设 索赔 次 数 服 从 Possion (3),， 理赔 额 服 从 帆 累 托 分 布 (2， 
1 000)。 假 设 初始 盈余 为 1 000， 安 全 附加 为 0.1,， 保费 收取 在 年 初 ， 当 县 
余 为 负 时 保险 公司 则 会 破产 。 从 随机 数 表 选 出 的 在 (0，1) 区 间 均 名 分 布 
内 的 随机 数 0.23，0.94，0.49，0.34，0.21 来 模拟 理赔 的 时 间 间 隔 ， 用 随 
机 数 0.58，0.97，0.88，0.67，0.44 来 模拟 赔付 额 。 求 该 保险 公司 在 何 时 
破产 。 
16. 假设 索赔 的 时 间 间 隔 服 从 均值 为 1/3 的 指数 分 布 ， 理 赔 额 站 = 10'， 
t 为 索赔 发 生 的 时 刻 。 假 设 初 始 鄙 余 为 5,， 保费 的 收取 为 一 个 连续 的 过 程 ， 
收取 率 为 ct 且 i=0。 当 有 一 余 为 负 时 保险 公司 则 会 破产 。 随 机 产生 在 (0， 
1) 区 间 均 匀 分 布 随机 数 0.5,，0.8，0.9 来 模拟 理赔 的 时 间 间 隔 ， 求 在 已 知 
情况 下 e 的 条 件 来 保证 在 这 三 次 索赔 下 保险 公司 的 正常 运营 。 

17. 随机 抽取 随机 变量 了 的 三 个 样本 : 1，6，8， 应 用 Bootstrap 方法 计 
算 下 面 估 计 的 均 方 误差 。 

(1) 均 值 估计 ; 

(2)max(X); 

(3)min( 针 )。 


“ 335 ， 


精算 模型 


“ 336 


18. 假设 随机 变量 承 、 半 、-…、 关 独立 同 分 布 于 F(x)， 
组 观测 值 : 1.2、3.2、5.3、6.4、3.6、3.7、6.0、5.4、3. 
是 被 模拟 的 经 验 分 布 的 自助 样本 ， 每 个 样本 有 10 个 数据 : 

样本 1: 3.6、3.7、3.7、3.9、5.4、1.2、3.2、3.2、3. 

样本 2: 1.2、1.2、5.3、5.3、3.9、3.2、3.2、3.1、5. 
样本 3: 3.9、3.9、6.0、6.0、5.4、1.2、3.9、6.0、1. 
使 用 这 三 个 自助 禅 本 估计 样本 方差 估计 值 的 MSE。 

19. 假设 随机 变量 头 、 头 ,、……、XX。 独 立 同 分 布 于 F(x)， 
组 观测 值 : 1.2、3.2、5.3、6.4、3.6、3.7、6.0、5.4、3. 
是 被 模拟 的 经 验 分 布 的 自助 样本 ， 每 个 样本 有 10 个 数据 : 

样本 1: 3.6、3.7、3.7、3.9、5.4、1.2、3.2、3.2、 

样本 2: 1.2、1.2、5.3、5.3、3.9、3.2、3.2、3.1、5. 
样本 3: 3.9、3.9、6.0、6.0、5.4、1.2、3.9、6.0、1. 
使 用 这 三 个 自助 样本 估计 P( 素 <5) 估 计 值 的 MSE。 

20. 假设 随机 变量 关 、 半 ,、-…、 半 ,独立 同 分 布 于 F(x)， 
组 观测 值 : 1.2、3.2、5.3、6.4、3.6、3.7、6.0、5.4、3. 
是 被 模拟 的 经 验 分 布 的 自助 样本 ， 每 个 祥 本 有 10 个 数据 : 

样本 1: 3.6、3.7、3.7、3.9、5.4、1.2、3.2、3.2、3. 

样本 2: 1.2、1.2、5.3、5.3、3.9、3.2、3.2、3.1、5. 
样本 3: 3.9、3.9、6.0、6.0、5.4、1.2、3.9、6.0、1. 
使 用 这 三 个 自助 样本 估计 0.3 分 位 点 估计 值 的 MSE。 
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口 了 解 精算 建 模 的 一 般 过 程 
$14.1 引言 


精算 建 模 的 目的 不 在 于 完成 一 次 数学 运算 ， 也 不 在 于 提供 一 个 关于 保 
险 环境 的 过 分 复杂 的 描述 。 其 实 ， 建 立 并 分 析 模 型 的 目的 是 回答 关于 保险 
赔付 、 投 资 组 合 及 管理 运营 方面 的 一 些 重大 问题 。 

我 们 已 经 在 前 面 各 章 讨 论 了 基本 风险 模型 的 性 质 、 参 数 的 估计 、 模 型 
的 选择 与 调整 等 一 系列 问题 。 这 些 问 题 都 是 分 开 讨 论 的 ， 本 章 将 用 两 个 案 
例 来 具体 说 明 精 算 建 模 的 过 程 。 第 一 个 例子 是 关于 退 体 人员 的 养老 金 问题 ; 
第 二 个 例子 是 关于 再 保险 定价 问题 。 

值得 注意 的 是 ， 我 们 所 讨论 的 案例 都 是 对 前 面 介 绍 的 多 种 方法 的 综合 
运用 。 案 例 的 假设 或 承保 责任 可 能 简化 或 复杂 了 实际 情况 ， 但 可 以 帮助 我 
们 考虑 解决 各 方面 的 问题 。 


$14.2 退休 人 员 的 死 廊 时 间 和 养老 金 


14.2.1 案例 介绍 

下 面 我 们 将 用 实例 说 明 一 个 经 验 生 命 表 的 构建 过 程 ， 并 以 生命 表 为 基 
础 讨论 寿险 赔付 的 一 些 基 本 计算 。 假 设 我 们 要 研究 退休 后 人 群 的 死亡 规律 ， 
表 14 -1 给 出 了 调查 得 到 的 暴露 数 和 实际 死亡 数 0。 

我 们 把 死亡 人 数 9. 看 成 是 基于 样本 规模 n, 的 二 项 分 布 随机 变量 ， 于 是 
q = 9./n, 作为 真实 死亡 率 q, 的 初始 估计 值 ( 表 14 ~1 中 称 之 为 “ 粗 死亡 
率 ”)。 图 14 -1 描述 了 不 同年 龄 的 粗 死 亡 率 值 ， 直 观 上 看 这 些 估计 值 在 高 
龄 部 分 不 是 光滑 的 ， 有 必要 进行 进一步 的 建 模 处 理 。 


@ 该 数据 是 近似 数据 ， 来 自 于 Dick London 著 、 徐 诚 浩 译 ;《 修 匀 数 学 》， 上 海 科学 技术 出 版 社 1996 年 
版 ， 第 203 页 。 


精算 模型 























































































































































































































年 龄 死亡 数 | 暴露 数 a 估计 年 龄 死亡 数 | 暴 能 数 估计 
x 0, ns 9 标准 差 x 0, ns 0 标准 差 
55 1 84 | 0.01190 |0.011834 80 374 6 140 0. 06091 | 0. 003052 
56 2 418 | 0.00478 |0.003375 81 348 4718 0.07376 | 0.003805 
57 10 1 066 | 0. 00938 |0.002953 82 304 3 791 0. 08019 | 0.004411 
58 21 2 483 | 0.00846 |0.001838 83 249 2 806 0. 08874 | 0. 005368 

59 35 3 721 0. 00941 |0.001582 84 167 2 240 0. 07455 | 0. 00555 
0. 01136 | 0. 001434 85 192 1715 0.11195 | 0.007614 
0. 00802 | 0.00113 86 171 1 388 0. 12320 | 0. 008822 
62 55 8 061 0.00682 |0.000917 87 126 898 0.14031 | 0.01159 
88 9 487 | 0. 00928 | 0. 000984 88 86 578 0. 14879 | 0.014803 
0.01226 |0.00106 89 97 510 0. 19020 | 0.017378 
0.01100 |0.00067 90 93 430 0.21628 | 0.019854 
66 300 26 791 | 0.01120 | 0.000643 91 了 9 362 0. 20718 | 0.021301 
67 432 29 174 | 0.01481 | 0. 000707| 92 84 291 0. 28866 | 0. 026564 
68 491 28 476 | 0.01724 | 0.000771 93 31 232 0. 13362 | 0.022338 
69 422 0.01633 |0.000788 94 75 196 0.38265 | 0.034717 
0.01986 95 29 -147 0. 19728 | 0.032822 
0. 01929 | 0. 00094 96 25 100 0.25000 | 0.043301 
72 0.02386 |0.001076 97 20 | 161 0. 12422 | 0.025995 
0.02845 |0.00121 98 5 11 0.45455 | 0.150131 
0. 03242 | 0. 00134 99 3 10 0. 30000 | 0. 144914 
0. 03870 | 0. 001574 100 2 8 0. 25000 | 0.153093 
0. 03909 | 0. 001779| 101 0 5 0.00000 | 0 
0. 04609 | 0. 002097 102 2 4 0. 50000 | 0. 25 
0. 04839 | 0. 002268 103 0 2 0. 00000 | 0 





















0. 06644 





0. 002829 














关于 死亡 率 序 列 的 真实 模式 应 满足 以 下 三 个 要 素 : 


(1) 它 是 光滑 的 ; 


(2) 它 是 随 x 而 递增 的 ; 


(3) 在 高 年 龄 区 间 内 ， 曲 线 旦 更 陡 的 上 升 趋 势 。 











0. 50000 





0.353553 


在 图 14 -1 中 ，g, 的 基本 趋势 满足 先 验 观点 要 素 (2) 和 (3)。 但 是 
在 55 ~65 岁 的 死亡 率 具有 小 幅 波 动 ， 特 别 是 55 岁 和 60 岁 的 死亡 率 明 显 高 
于 其 他 相近 年 龄 ; 另外 在 91 岁 以 后 的 死亡 率 呈 剧烈 的 锯齿 状 ，101 岁 和 
103 岁 的 死亡 率 等 于 0。 这 与 先 验 观 点 不 符 。 从 样本 数 可 以 看 出 ,55 岁 、 


' 358 、 
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98 ~ 104 岁 的 样本 数 较 少 ， 估 计 标 准 差 
相应 也 比较 大 ， 因 此 这 些 估计 和 值 的 可 
信 度 不 高 。 修 匀 的 目的 就 是 要 改进 这 
些 初始 估计 值 ， 使 其 满足 先 验 的 观点 。 

在 这 里 ， 我 们 以 Whittaker 修 义 和 
样 条 修 匀 为 例 说 明 表 格 和 参数 修 匀 的 
过 程 ， 对 每 一 种 情形 ， 都 给 出 方法 的 
叙述 ， 且 用 表格 和 图 形 两 种 形式 介绍 





了 三 EE n, > = 
所 得 的 结果 。 用 vw, 二 计生 条 Dr oa 
个 结果 的 拟 合 度量 ,光滑 度 量 为 S$ = 图 14 -1 粗 死 亡 率 


(A'v,)”。 对 每 种 单个 修 色 方法 都 给 
出 这 两 种 度量 。 在 图 上 也 可 观察 拟 合 性 和 光滑 性 。 


14.2.2 死亡 率 的 修 匀 

1. Whittaker 修 匀 。 用 式 (11.2.10) 给 出 的 基本 方法 施行 以 下 两 种 修 
匀 方 法 ,在 两 种 情形 下 都 取 z=4， 所 计算 的 权重 为 : 

LL 
es 

为 了 说 明 参 数 h 的 作用 ， 我们 取 两 个 不 同 的 h 值 。 在 图 14 -2 中 分 别 
取 有 =1 000 和 及 =426 138 (w, 的 平均 值 )。 正 如 11.2.2 中 所 讨论 的 那样 ， 
在 修 匀 结果 中 ， 大 的 h 值 产生 大 的 光滑 性 ,但 是 却 偏离 了 初始 估计 。 所 得 
结果 在 表 14 -2 中 表示 。 

为 了 避免 在 计算 权时 出 现 分 母 是 0 的 情形 (初始 估计 值 qiu = qo, =0)， 
可 任意 用 gw =0.25 和 gio =0.5 代替 之 。 


表 14 -2 修 匀 结果 









































































刺 hittaker 修 匀 值 Whittaker 修 匀 值 样 条 修 
h=426 138 x h=1000 | h=426 138 匀 值 

0. 00990 0. 00387 0.00715 61 0.00810 0. 00830 0. 00878 

56 0. 00548 0. 00620 0. 00747 62 0. 00681 0. 00813 0. 00920 

57 0. 00854 0. 00815 0. 00773 63 0. 00931 0. 00902 0. 00973 
58 0. 00862 0. 00939 0. 00796 64 0. 01218 0.01016 0. 001041 

59 0. 00954 0. 00971 0.00819 0.01102 0.01102 0.01126 

60 0. 01115 0. 00916 0. 00846 | 66 0.01121 0.01226 0. 01232 

b= 
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入 和 人 让 和 二 5 
续 表 
年 龄 Whittaker 修 匀 值 样 条 修 年 龄 Whittaker 修 匀 值 样 条 修 
x h=1000 | h=426 138 匀 值 x h=1000 | hk=426 138 匀 值 
67 0. 01481. 0.01430 0.01361 86 0. 12349 0. 11976 0. 12119 
68 0.01718 0. 01624 0. 001516 87 0. 14048 0. 13935 0. 13325 
69 0. 01645 0. 001746 0. 01701 88 0. 15951 0. 16085 0. 14615 
70 0. 01969 0. 01862 0. 01918 89 0. 18469 0. 18209 0. 15959 
71 0. 01943 0. 02047 0. 02170 90 0. 20726 0. 20069 0. 17298 
72 0. 02378 0. 2372 0. 02459 91 0. 21917 0. 21453 0. 18572 
73 0. 02840 0. 02803 0. 02790 92 0. 22253 0. 22212 0. 19722 
74 0. 03263 0. 03257 0. 03164 93 0. 22449 0. 22290 0. 20686 
75 0. 03828 0. 03683 0. 03585 94 0. 23026 0.21739 0. 21405 
76 0. 03972 0. 04102 0. 04055 95 0. 22027 0. 20708 0. 21819 
77 0. 04493 0. 04593 0. 04578 96 0. 19142 0. 19453 0. 21867 
78 0.05036 | 0.05197 97 0. 16012 0. 18312 0. 21488 
79 0. 06290 0. 05877 0. 05792 98 0. 15134 0. 17683 0. 20624 
80 | 0.06387 0. 06540 0. 06489 99 0. 17660 0. 17992 0. 19213 
81 0. 07225 0. 07140 0. 07251 100 0. 23486 0. 19680 0. 17196 
82 0. 08109 0. 07698 0. 08079 101 0. 31745 0. 23194 0. 14511 
83 0. 08313 0. 08317 0. 08977 102 0. 41135 0. 28982 0. 11100 
84 0.08352 0. 09157 0. 09948 103 0. 50127 0. 37493 0. 06901 
85 104 0. 57134 0.49176 0. 01885 


两 种 结果 的 拟 合 性 与 光滑 性 度量 分 别 为 : 

h=1 000: F =68. 12450, S =0. 00461 

h =426 138 : 五 =113. 40598 ， S =0. 00019 

2. 样 条 修 匀 。 由 于 样 条 修 匀 是 一 种 参数 修 义 ， 本 身 就 是 光滑 的 ， 所 以 
此 时 不 必 计 算 光 滑 度量 。 这 里 采用 两 弧 三 次 样 条 : 
| 5 a<x<k 


2 二 


x 


pi(%), k<x<b 
由 于 初始 估计 值 在 90 岁 后 发 生 较 大 波动 ， 因 此 取 内 结 点 上 =87.5。 得 到 结 
果 列 在 表 14 ~2 中 的 “ 样 条 修 匀 值 ” 列 。 拟 合 度量 值 等 于 下 =153.78。 
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虽然 图 14 -3 中 的 样 条 修 匀 值 是 光滑 的 ， 但 是 相 比 较 而 言 ， 拟 合 性 度 
量 值 比 Whittaker 要 高 ， 而 且 在 高 年 龄 段 的 死亡 率 没 有 体现 出 递增 性 。 因 
上 此， 如果 单调 性 是 重要 的 ,那么 Whittaker 修 匀 的 结果 要 比 样 条 结果 好 。 在 
实际 应 用 中 ， 生 命 表 编制 不 一 定 只 用 一 种 修 勾 ， 可 以 在 不 同 的 年 龄 段 采用 
不 同 的 修 匀 方法 。 


粗 死亡 率 
0. 








60 70 80 90 100 年 龄 60 70 80 90 100 年 龄 


图 14 -2 Whittaker 修 匀 结果 图 14 -3 样 条 修 匀 值 


14.2.3 死亡 时 间 
综合 比较 修 勾 结果 ，Whittaker 修 匀 结果 的 拟 合 性 较 好 ， 光 滑 性 度量 值 
与 样 条 修 匀 差别 不 大 。 因 此 我 们 选 定 Whittaker 修 匀 (h=1 000) 后 的 死亡 


率 ， 由 此 得 到 55 岁 生 存 的 人 在 55 岁 以 后 的 生存 概率 ， 如 表 14 -3 和 图 
14 一 4 所 示 。 




































































































表 14 -3 55 岁 以 后 退休 人 员 的 生存 函数 
年 龄 z 。 | 死亡 率 | 。 生存 概率 生存 概率 总 
55 0. 00990 1 0.01102 0. 913884 
56 0. 00548 0. 9901 0. 01121 0. 903813 
57 0. 00854 0.984674 0. 01481 0. 893681 
58 0. 00862 0.976265 0.01718 0, 880446 
59 0.00954 0. 96785 0.01645 0. 86532 
- 60 0.01115 0.958616 0.01969 0. 851085 
61 0.00810 0. 947928 0. 01943 0. 834327 
62 0. 00681 0. 94025 0. 02378 0. 818116 
63 0. 00931 0. 933847 0. 02840 0.798662 
64 0.01218 0. 925152 0.03263 0.77598 
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和 
缮 表 
年 伶 v | 死亡 率 | ， 生存 概 率 | 年 岭 + | 死亡 计 生存 概率 各 
er 0.750659 90 0. 20726 0. 18311 
一 一 
76 0. 03972 0. 721924 91 0. 21917 0. 145158 
77 0. 04493 0.693249 92 0. 22253 0. 113344 
78 0.05036 0.662102 93 0. 22449 0. 088121 
79 0. 06290 0. 628758 94 0.23026 0. 068339 
80 0. 06387 0. 589209 95 0. 22027 0. 052603 
81 0. 07225 0.551577 96 0. 19142 0.041016 
82 0. 08109 0.511725 0. 16012 0.033165 
83 0. 08313 i 0.470229 98 | 0. 15134 0. 027855 
84 0. 08352 0. 431139 99 0. 17660 0. 023639 
85 0. 10236 0. 39513 100 0. 23486 0. 019464 
86 0. 12349 0. 354685 101 0. 31745 0. 014893 
87 0. 14048 0.310885 102 | 0.41135 0.010165 
88 0.15951 0.267212 103 0.50127 0. 005984 
89 0. 18469 0. 224589 104 0.57134 0. 002984 





























14 -4 退休 人 员 的 生存 函数 


在 生命 表 14 -3 的 基础 上 ， 可 计算 人 寿 保 险 的 赔付 问题 。 在 人 寿 保险 
中 ， 人 们 并 不 特别 关心 免 赔 、 限 额 和 共 保 等 条 款 。 我 们 考虑 如 下 两 个 问题 : 

(1) 当前 为 55 岁 退 休 的 个 体 ， 退 休 后 在 生存 期 间 每 年 年 初 领取 1 万 元 
养老 金 ， 以 5% 的 年 利率 订 算 这 些 现金 流 的 期 望 现 值 。 

(2) 当前 为 60 岁 的 个 体 ， 若 在 死亡 时 刻 给 付 1 万 元 ， 以 5% 的 年 利率 
计算 该 现金 流 的 期 望 现 值 。 
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对 于 第 一 个 问题 ， 现 值 随机 变量 可 以 表示 为 Y=10 000(Y +…+ 
Ys) ， 其 中 了 表示 生存 到 55 +j 的 条 件 下 受益 1 元 的 现 值 , j =1,…,50。 
则 有 、 


, S(55 +)) 
1.05 二 和 
i S(55 + 门 

> 二 7， 
0s 1 -gs5) 


51 


E(Y) = 10 000 5 1.05°S(55 +)) 
710 


S(55) 

对 于 第 二 个 问题 ， 先 把 年 利率 5% 转化 为 连续 利率 6=4.879% , 令 Z= 
10 000e “表示 现 值 随 机 变量 ,其 中 7 表示 60 岁 的 个 体 的 未 来 生存 时 间 ， 
以 年 为 单位 。 现 值 期 望 的 计算 公式 为 : 


45 
E(Z) = 10 000[ em td 


其 中 生存 函数 在 整数 年 龄 之 间 的 值 由 线性 插值 得 到 ， 密度 畏 数 为 曲线 的 斜 
率 。 将 积分 区 域 分 为 46 个 区 间 ， 有 
(S(60 +7) - $(60))/S(55) -0 oer 


= 144 508. 56 


45 








五 (Z) = 10 oo 0 S33 . dt 
45 , : ; 
(S(60 + 站 end S(60))/S(55) B89 CBU 
= 让 CN 
9 > S(60)/S(55) 人 0. 04879 ) 
= 4 685.4 


$14.3 再保险 定价 案例 分 析 


14.3.1 案例 介绍 


假设 你 是 FW 再 保险 公司 的 定价 精算 师 。FW 公司 在 全 球 再 保险 市 场 
中 具有 一 定 地 位 ， 并 且 在 承保 绝 大 多 数 风 险 方面 享有 盛誉 。 现 在 FEW 公司 
要 求 你 为 一 个 新 的 险种 一 金融 董事 及 高 级 职员 责任 保险 ， 做 限额 损失 
再 保险 定价 和 偿付 能 力 方面 的 分 析 。 和 董事 及 高 级 职员 责任 保险 承保 被 保 
险 董 事 及 高 级 职员 在 执行 职务 过 程 中 ， 由 于 单独 或 共同 的 过 错 行 为 导致 
第 三 者 遭受 经 济 损失 ， 依 法 应 由 被 保险 董事 及 高 级 职员 承担 的 赔偿 责任 。 
这 种 责任 险 保 单 是 损失 发 生 制 保单 ， 即 保险 公司 承担 上 述 赔 偿 责 任 时 以 
被 保险 董事 及 高 级 职员 引起 索赔 的 过 错 行 为 发 生 于 保单 约定 的 湖 及 日 后 ， 
并 且 第 三 者 在 保险 期 限 内 首次 回 被 保险 董事 及 高 级 职员 提出 索赔 为 限 。 

关于 这 个 险种 几乎 没有 历史 数据 ， 所 以 也 没有 类 似 的 行业 定价 数据 。 
不 过 幸好 ，FW 公司 的 这 个 客户 曾经 承保 过 这 种 业务 ， 拥 有 关于 这 方面 的 赔 
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付 数据 。 对 于 每 次 索赔 事件 ， 你 的 客户 提供 的 数据 都 含有 五 个 方面 的 信息 : 
(1) 索赔 发 生 的 保单 年 ; (2) 董事 和 高 级 职员 的 工作 领域 ， 这 里 主要 有 三 
类 : 保险 公司 、 银 行 以 及 证 券 公司 ; (3) 保单 承保 时 的 免 赔 额 ， 包 括 没有 
免 赔 额 情形 ; (4) 保单 的 限额 ， 这 里 用 最 大 赔付 额 来 表示 ; (5) 保险 公司 
的 赔付 额 。 数 据 见 表 14 -4 和 表 14 -50。 

对 于 责任 险 来 说 ， 当 一 次 索赔 发 生 时 ， 可 能 需要 经 过 几 年 甚至 几 十 年 ， 
最 终 的 责任 额 才能 确定 。 因 此 为 了 消除 时 间 的 影响 ， 这 里 我 们 假设 表 中 的 
数据 都 是 经 过 趋势 化 预测 的 最 终 损 失 。 

此 外 ， 你 的 客户 还 提供 了 损失 次 数 数据 。 在 每 个 保单 年 ， 你 都 将 获得 
签单 的 保单 数 ， 其 中 包括 三 个 不 同 工 作 类 型 的 董事 和 高 级 职员 责任 险 在 各 
保单 年 的 签单 数 。 作 为 保险 合约 的 一 部 分 ,被 承保 的 董事 和 高 级 职员 被 要 
求 提 供 所 有 的 发 生 的 责任 险 事故 ， 无 论 事 故 的 损失 额 是 否 超过 免 赔 额 。 因 
此 ， 除 了 前 面 的 索赔 人 额 数 据 外 ， 你 还 获得 了 每 年 的 损失 次 数 数据 。 

作为 定价 精算 师 ， 公 司 要 求 你 对 这 个 再 保险 新 险种 进行 定价 。 根 据 客 
户 提供 的 数据 ， 你 需要 完成 下 面 的 任务 : 

第 一 ,假设 三 个 不 同 工 作 领 域 的 董事 和 高 级 职员 的 风险 水 平 是 一 样 
的 ， 也 就 是 说 ， 他 们 发 生 索 赔 的 可 能 性 一 样 ， 索赔 额 的 分 布 也 相同 。 在 
这 样 的 假定 下 ， 如 果 对 单 张 保单 承保 限额 损失 再 保险 ， 即 如 果 保 单 的 原 


“ 始 索 赔 额 低 于 自 留 额 ， 则 FW 公司 不 承担 赔付 责任 ; 如 果 高 于 自 留 额 ， 则 


只 赔付 超过 自 留 额 以 上 的 部 分 原 索 赔 额 。 除 了 原 保 单 的 保单 限额 外 ， 我 
们 不 考虑 再 保险 限额 存在 的 情况 。 你 被 要 求 估 计 再 保险 赔付 额 的 分 布 ， 
并 获得 该 分 布 的 均值 、 标 准 差 和 90 以 及 99% 分 位 数 。 在 此 基础 上 ， 当 
保单 组 合 为 100 张 保单 ， 且 每 张 保 单 都 具有 相同 的 自 留 客 时， 计算 再 保 
险 总 赔付 额 的 分 布 。 

第 二 ， 考 虑 总 损失 限额 再 保险 情形 。 总 损失 限额 再 保险 是 对 一 个 日 
历年 内 签单 的 所 有 保单 总 赔付 额 进 行 再 保险 ， 当 总 赔付 额 超过 总 自 留 额 
时 ，FW 公司 将 对 超过 的 部 分 进行 赔付 。 假 设 你 已 经 知道 这 些 保单 的 数 
目 ， 如 100 份 保单 。 假 设 这 100 份 保单 具有 相同 的 保单 限额 ， 且 没有 免 赔 
额 。 你 需要 决定 各 种 不 同 总 自 留 额 及 保单 限额 对 应 下 的 再 保险 费 率 ， 并 
县 估计 再 保险 赔付 额 的 分 布 ， 获 得 分 布 的 均值 、 标 准 差 和 90% 以 及 99% 
分 位 数 。 

第 三 ， 研 究 是 否 需 要 对 三 个 不 同 工 作 领域 的 董事 和 高 级 职员 分 开 考 虑 ， 
也 就 是 检验 三 类 董事 和 高 级 职员 风险 水 平 是 否 一 致 。 你 需要 构建 一 个 合 


人 @ 数据 来 自 Kiugman, S. T. ， 开 . H. Panjer and G..E. Willmot “Loss Models: From Data to Decisions”, 
John Wiley & Sons 1998, 第 18 ~21 页 。 
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的 检验 来 判断 三 个 不 同 工 作 领域 的 董事 和 高 级 职员 的 索赔 额 和 索赔 次 数 分 
布 是 否 一 致 。 是 建立 一 个 简单 模型 ， 还 是 建立 三 个 不 同 模型 ? 哪 种 更 为 合 
理 ? 可 以 利用 信 度 理论 对 此 进行 比较 分 析 。 更 进一步 ， 你 预计 客户 可 能 要 
求 经 验 定价 。 这 将 是 一 种 追 淹 定 价 ， 即 如 果 某 年 发 生 的 实际 再 保险 赔付 很 
低 ， 则 下 一 年 的 再 保险 费 将 降低 ; 反之 ， 如 果实 际 再 保险 赔付 很 高 ， 则 再 
保费 将 升 高 。 

第 四 ， 你 要 说 服 你 的 客户 ， 购 买 再 保险 是 一 个 明智 的 选择 。 你 可 以 通 
过 比较 五 年 内 客户 的 破产 概率 来 说 明 。 如 果 购 买 了 再 保险 ， 和 破产 概率 会 降 
低 。 或 者 ， 你 可 以 说 明 购 买 再 保险 将 会 使 你 的 客户 维持 该 项 责任 险 的 初始 
盈余 降低 。 


表 14 -4a 保险 公司 董事 和 高 级 职员 























































最 大 支付 额 | 赔付 额 最 大 支付 额 | 赔付 额 

1990 0 1 000 000 2 890 1991 15 000 000 | 10 000 000 | 10 000 000 
1990 0 5 000 000 5 851 1992 0 1 000 000 1 836 
1990 250 000 | 10 000 000 15 347 1992 0 1 000 000 10 705 
1990 0 1 000 000 15 635 1992 0 5 000 000 10 973 
1990 0 3 000 000 20 553 1992 0 5 000 000 13 408 
1990 0 | 10 000 000 34 584 1992 0 | 10 000 000 16 339 
1990 0 | 10 000 000 79 661 1992 350 000 5 000 000 95 736 
1990 0 400 000 132 601 1992 0 1 000 000 212 313 
1990 1 500 000 5 000 000 1 410 989 1992 0 5 000 000 439 543 
1990 0 |10 000 000 2 784 401 1992 70 000 000 | 15 000 000 1 098 710 
1990 0 | 10 000 000 4 894 360 1992 0 3 000 000 1 211 180 
1990 10 000 000 | 10 000 000 9 316 751 1993 0 500 000 10 510 
1991 0 1 000 000 1 891 1993 0 3 000 000 14 029 
1991 0 3 000 000 30 893 1993 0 | 10 000 000 15 296 
1991 0 1 000 000 31 392 1993 50 000 1 000 000 27 516 
1991 500 000 | 10 000 000 49 488 1993 0 | 10 000 000 53 467 
1991 175 000 1 000 000 67 425 1993 300 000 5 000 000 87 463 
1991 0 1 000 000 150 310 1993 100 000 5 000 000 220 995 
1991 45 000 000 | 33 000 000 1 335 735 1993 150 000 5 000 000 274 086 
1991 0 |10 000 000 3 308 199 1993 0 5 000 000 1 862 304 

12 750 000 | 10 000 000 | 10 000 000 0 5 000 000 5 000 000 
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表 14 -4b 


大 六 人 训 | 记 


年 份 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1990 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 
1991 


5 000 000 
75 000 

0 

5 000 000 
12 000 000 
50 000 
500 000 

0 

4 500 000 
1 500 000 
16 000 000 
500 000 
55 000 000 


0 
0 
0 
0 
0 
0 
0 


100 000 
100 000 

10 000 000 
0 

1 000 000 
30 000 000 
200 000 

0 

0 

500 000 


5 000 000 
1 000 000 
1 000 000 
1 000 000 
5 000 000 
2 000 000 
3 000 000 
1 000 000 
2 000 000 
5 000 000 
1 000 000 
10 000 000 
3 000 000 
5 000 000 
30 000 000 
10 000 000 
10 000 000 
10 000 000 
10 000 000 
10 000 000 
3 000 000 
1 000 000 
500 000 

10 000 000 
1 000 000 
3 000 000 
3 000 000 
3 000 000 
1 000 000 
5 000 000 
1 000 000 
10 000 000 
1 000 000 
6 000 000 
10 000 000 
5 000 000 
10 000 000 
10 000 000 
10 000 000 


> 
银行 董事 和 高 级 职员 

10 548 1991 

12 959 1991 

13 456 1991 

16 148 1992 
20 684 1992 

23 691 1992 
27 196 1992 
28 283 1992 
169 616 1992 
268 534 1992 

1 000 000 1992 
1 033 715 1992 
1 363 432 1992 
2 205 674 1992 
3 148 409 1992 
8 652 788 1992 
8 719 031 1992 
9 508 586 1992 
1 362 1992 

”1 883 1992 
3 394 1992 

4 246 1992 

6 992 1992 

10 262 1992 

16 452 1992 

20 427 1993 

27 494 1993 
30 698 1993 

45 743 1993 
52 023 1993 

54 481 1993 
164 732 1993 
535 593 1993 

1 491 732 1993 
2 271 437 1993 
2 732 422 1993 
3 130 873 1993 
3 622 812 1993 
4 288 766 1993 





0 
0 
10 000 000 


0 

350 000 
150 000 

75 000 

0 

0 

0 

10 000 000 
10 000 000 
700 000 


ee = = ~ 


1 000 000 
100 000 

1 000 000 
100 000 
0 

0 


10 000 000 
5 000 000 
20 000 000 
5 000 000 
1 000 000 
5 000 000 
10 000 000 
10 000 000 
1 000 000 
3 000 000 
5 000 000 
5 000 000 
7 500 000 
400 000 

1 000 000 
5 000 000 
3 000 000 
5 000 000 
1 000 000 
1 000 000 
10 000 000 
5 000 000 
10 000 000 
5 000 000 
20 000 000 
5 000 000 
10 000 000 
1 000 000 
1 000 000 
10 000 000 
1 000 000 
10 000 000 
5 000 000 
10 000 000 
10 000 000 
10 000 000 
5 000 000 
10 000 000 
10 000 000 


4 435 099 
5 000 000 
5 644 894 
1 003 

2 388 

3 067 

4 066 

6 758 

6 781 

7 439 

10 617 

10 888 

34 745 

58 587 
113 166 
122 967 
199 607 
298 847 

1 000 000 
1 000 000 
3 022 258 
3 201 434 
3 754 944 
5 000 000 
6 126 080 
189 

388 

2 026 

2 354 

8 959 
17 865 
41 170 
158 391 
596 674 
926 657 
101 816 


i 


1 903 358 
2 055 117 
2 966 399 
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表 14 -4c 证 券 公司 董事 和 高 级 职员 


年 份 免 赔 额 最 大 支付 额 赔付 额 
1990 0 7 500 000 60 664 








1990 5 000 000 5 000 000 116 134 
1990 7 500 000 576 857 
1991 1 000 000 31 698 


1991 10 000 000 46 427 





1991 7 500 000 119 206 
1991 450 000 1 000 000 405 796 
1991 0 5 000 000 1 519 846 
1991 500 000 2 000 000 2 000 000 
1992 0 1 000 000 505 
1992 250 000 5 000 000 17 833 
1992 0 3 000 000 20 546 
1992 22 000 000 10 000 000 10 000 000 
1993 20 000 5 000 000 4 699 
1993 150 000 10 000 000 6 055 
1993 0 1 000 000 10 950 
1993 25 000 000 10 000 000 244 026 
1993 100 000 1 000 000 255 892 


1993 0 5 000 000 384 222 











表 14 -5 风险 暴露 数 和 损失 次 数 
保险 公司 银行 证 券 公 司 
0 风险 暴露 数 损失 次 数 ”| 风险 暴露 数 | 损失 次 数 ”| 风险 暴露 数 损失 次 数 
1990 853 20 1 446 27 639 5 
1991 1 105 14 1 780 35 725 8 
1992 1 148 16 1 717 36 685 4 
1993 1 270 21 2 065 24 864 11 




















14.3.2 过 周强 度 建 和 


我 们 先 对 索赔 强度 进行 建 模 分 析 。 假 设 三 类 公司 的 董事 和 高 级 职员 的 
损失 强度 分 布 都 相同 ,用 关 表 示 一 次 损失 事件 的 损失 额 。 由 于 我 们 的 数据 
有 很 多 不 同 的 免 赔 额 和 赔偿 限额 ， 而 且 极 大 似 然 估计 具有 很 好 的 统计 性 质 ， 
因此 我 们 选择 极 大 似 然 估计 来 估计 和 参数。 如 果 保 单 的 免 赔 额 是 4， 最 大 赔 
付 额 是 工 ， 则 获得 最 大 赔付 额 的 保单 损失 至 少 大 于 4d+Z， 因 此 我 们 记 v =da 


"367 


精算 模型 


+ 工 为 最 大 损失 。 每 次 索赔 事件 ， 原 保险 公司 的 赔付 额 及 为 : 
未 定义 ， X¥<d 
Y=/X¥-d, d<¥X<u 
也， XX>Lu 
其 分 布 密度 晴 数 为 : 
fr(x+d) 
1 一 FrCd) 
fy (x) = (14.3.1) 
1—-F(u) 
1-F(d)’ 
其 中 ,， f(x) ，Fi(x) 分 别 是 保单 原 损 失 针 的 分 布 密度 晴 数 和 分 布 油 数 。 我 
们 初步 选择 了 12 个 分 布 ， 根 据 式 (14.3.1) 写 出 极 大 似 然 函数 ， 使 用 单纯 
形 法 ， 我 们 这 里 得 到 了 12 个 分 布 的 参数 估计 ， 见 表 14 -6。 可 以 看 出 12 个 
模型 中 对 数 正 态 分 布 得 到 的 极 大 似 然 值 最 大 〈 负 的 值 最 小 ) 。 参 数 估计 结 
果 为 让 =10.5442， =2.31307。 


XX<u 
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表 14 -6 12 个 分 布 的 参数 估计 
分 布 名 称 参数 估计 负极 大 似 然 值 
Inverse exponential 日 =84.28567 2 103. 262 
Lognormal =10.544183 ca =2.313068 1 781. 173 
韦伯 7 =0.1120341 6 =8.5822086 1 922. 383 
Loglogistic y=0.2468978 48=14.0573170 1 921.999 
Paralogistic a=0.088222 6=12.478940 2 240. 939 
Inverse paralogistic 7=0.0899498 0=18.2063624 2 237. 876 
帕 累 托 a =0.1951758 0=30.6099376 1 877. 975 
Inverse 帕 累 托 7=38.22458 =81.02645 1 860. 935 
Jnverse Caussian £=1 000 005.82 A=1 016.012 1 834. 673 
Inverse 韦伯 8=20.5138478 7=0.2351234 1 903. 707 
7=0.0516133 8=12.5121518 
Inverse Bur 2 229. 544 
y =0.2104612 
x; =5.276204 jz =38.441207 
Generalized 帕 累 托 1 898. 977 
B=38.081655 











虽然 从 似 然 值 上 对 数 正 态 分 布 看 起 来 比 其 他 模型 要 优 ， 但 是 我 们 还 是 
需要 做 进一步 的 检验 分 析 对 数 正 态 分布 是 否 可 以 足够 好 地 拟 合 样本 数据 ， 
这 样 才 可 以 放心 地 使 用 这 个 分 布 模型 。 否 则 的 话 ， 我 们 将 不 得 不 考虑 其 他 
一 些 复杂 的 模型 ， 比 如 ， 两 点 混合 分 布 。 由 于 存在 不 同 的 免 陪 额 ， 使 得 卡 
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方 拟 合 优 度 检 验 无 法 使 用 。 同 样 也 没有 明显 的 经 验 分 布 函 数 来 做 Kolmogor- 
ov - Smirnov 检验 。 但 是 我 们 可 以 构造 近似 的 经 验 分 布 旺 数 ， 即 Kaplan - 
Meier 有 限 乘 积 估计 量 。 

具体 步骤 如 下 。 首 先 ， 对 于 每 一 个 赔付 z, j=1,…,n， 免 赔 额 4&， 限 
额 w,， 损失 x, =d +z,。 注 意 ， 在 我 们 通常 的 定义 下 ， 最 大 赔付 额 是 -4d,; 
在 一 般 情况 中 ，d, 可 能 为 0, wu 可 能 为 无 穷 大 。 现 在 取出 2n 个 数 {d,，-…， 
d,.,， xXx,，-… ,x,|] ， 并 将 它们 升序 排列 。 如 果 两 个 或 更 多 个 x 取 值 相同 ，x, = 
2 的 数 将 放 在 x; <w 的 数 之 后 。 将 这 些 排 序 后 的 数字 t= 4d 标记 为 4 ,…， 
to。 接 下 来 创建 一 系列 数值 6,,… ,65,,， 如 果 5 等 于 茶 个 d;:， 则 56, =0; 如 果 
t 等 于 某 个 x 且 x =w， 则 6,=1; 如 果 # 等 于 茶 个 x 和 且 x <u， 则 6, =2。 
用 公式 表示 为 : 


0 ， t=d, 
6,= 1, ti =X X= 
> ti =X Xe < 


【 例 14 -1】 对 表 14 -4e 中 的 数据 构造 经 验 分 布 函 数 的 Kaplan - Meier 
估计 量 。 
解 : 表 14 -4 中 有 19 个 观察 值 。 表 14 -7 将 其 中 的 免 赔 、 限 额 和 赔付 


额 转换 成 了 Kaplan - Meier 所 要 求 的 4d4、w 和 x。 表 14-8 将 {di,…,d,, x， 
，X.} 38 个 元 素 从 大 到 小 的 排列 ， 按 照 上 面 的 步骤 将 得 到 38 个 排序 后 的 
数值 及 它们 原始 数值 。 















表 14 -7 证 券 公 司 董事 和 高 级 职员 责任 赔付 
1 0 7 500 000 60 664 
2 5 000 000 10 000 000 5 116 134 
3 0 7 500 000 576 857 
4 0 1 000 000 31 698 
5 50 000 10 050 000 96 427 
6 0 7 500 000 119 206 
7 450 000 1 450 000 855 796 
8 0 5 000 000 1 159 846 
9 500 000 2 500 000 2 500 000 
10 0 1 000 000 505 
11 250 000 5 250 000 267 833 
12 0 3 000 000 20 546 
13 22 000 000 32 000 000 32 000 000 
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j d 

14 20 000 
15 150 000 
16 0 
17 25 000 000 
18 100 000 
19 0 

表 14 -8 





18 


19 











0 


0 


505 


10 950 


20 000 


20 546 


24 699 


31 698 


50 000 


60 664 


96 427 


100 000 


Kaplan - Meier 估计 的 排序 数值 





Ws 


J 


和 

















5 020 000 
10 150 000 
1 000 000 
35 000 000 
1 100 000 


5 000 000 


38 











119 206 


150 000 
156 055 
250 000 
267 833 
355 892 
384 222 
450 000 
500 000 
576 857 
855 796 

1 519 846 
2 500 000 
5 000 000 
5 116 134 
22 000 000 
25 000 000 
25 244 023 


32 000 000 


24 699 

156 055 

10 950 

25 244 023 
355 892 


384 222 





下 面 根据 这 些 信 息 ， 构 造 Kaplan - Meier 经 验 分 布 旺 数 。 从 F,(0) =0 
开始 。 设 置 计数 器 r=s=0， 变 量 y=0。 对 j=1,…,2n， 进 行 如 下 操作 ， 
。 如 果 6,=0, 令 r=r+l; 
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。 如 果 65,=1, 令 r=r-1; 

。 如 果 65,=2, 令 c=r-d,s=s+1, 令 y=t, F(y,)=1-[1- 
F,(yY,.1)]*c/r， 其 中 4d 为 1 相同 且 6 =2 的 连续 六 的 个 数 。 然 后 跳 到 下 一 
个 d -1 项。 

当 完 成 上 面 的 程序 ， 用 直线 将 F,(y,) 顺 次 连接 起 来 便 得 到 了 经 验 分 布 。 
表 14-9 是 例 14 -2 的 经 验 分 布 消 数 ， 图 14 -5 是 经 验 分 布 函数 图 。 











表 14 -9 例 14 -2 中 的 Kaplan - Meier 估计 
r s | Fy,) r s y, F.(y,) 
1 1 4 8 119 026 0.7407 
2 2 5 
3 3 4 9 156 055 0.7926 
4 4 5 
5 3 4 10 267 833 0. 8341 
6 6 3 11 355 892 0. 8756 
7 7 12 384 222 0.9170 
8 8 3 
9 9 4 
10 8 1 505 0. 1111 3 13 576 857 0. 9378 
11 3 2 10 950 0. 2222 二 14 855 796 0.9585 
12 8 1 15 1 519 846 0.9793 
13 党 3 20 546 0. 3194 0 
14 6 4 24 699 0.4167 1 a 
15 5 5 31 698 0.5139 0 16 5116 134 
16 6 1 
地 3 6 60 664 0. 5949 2 
18 4 7 96 427 0.6759 1 17 25 244 023 
19 5 0 





注意 ， 由 于 7 在 最 后 一 个 数值 前 达到 了 0 (最 后 一 个 数值 总 是 0)， 因 
此 在 yy, 取 值 为 1 519 846 时 ， 经 验 分 布 函数 达到 最 大 值 0.9793。 只 有 当 在 
组 后 一 个 观测 是 一 个 损失 (6 =2) 且 7 在 此 之 前 从 未 达到 0。 

类 似 地 ， 将 三 种 类 型 的 董事 和 高 级 职员 的 索赔 额 数 据 全 部 合 在 一 起 ， 
根据 上 面 的 步骤 求 得 经 验 分 布 函 数 。 图 14 -5 中 画 出 了 的 经 验 分 布 卫 数 和 
拟 合 的 对 数 正 态 分 布 。 尽 管 拟 合 得 不 特别 好 ， 但 已 经 相当 不 错 了 ， 特 别 是 
对 于 大 损失 的 拟 合 (高 于 exp (12.5) =268 000) 。 

损失 强度 建 模 的 最 后 任务 是 检查 是 否 应 当 对 三 个 样本 分 别 建 模 ， 可 使 
用 似 然 比 检验 完成 此 项 任务 。 零 假设 为 三 种 类 型 的 董事 和 高 级 职员 有 相同 
的 损失 强度 分 布 ， 表 14 - 10 给 出 了 三 个 样本 对 应 的 极 大 似 然 估计 值 。 似 
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然 比 检验 统计 量 取 值 为 2 x 
(1 781.17 -1 779.47) =3.4。 
自由 度 为 4,p 值 为 0.4932。 
因此 ， 无 法 拒绝 原 假设 。 


(x) Kaplan-Meier 经 验 分 


表 14 -10 三 种 类 型 的 极 大 

















似 然 函数 值 
样 本 负极 大 似 然 函 数值 
保险 533. 64 
银行 1 015. 37 
证 券 230. 46 0 500000 1000000 1500000 2000000 2 500000 3000000 
损失 
总 和 1 779. 47 





图 14 -$ 证 券 公 司 董 事 和 高 级 职员 损失 经 验 分 布 函数 图 


We 

对 于 损失 频率 的 建 模 ， 有 以 下 两 种 方法 : 

第 一 种 方法 : 将 这 个 混合 的 数据 集 看 成 是 一 个 来 自 于 无 限 可 分 总 体 的 
样本 ， 其 中 每 一 个 样本 观测 值 的 分 布 参数 都 不 同 ， 因 为 它们 这 些 参数 必须 
反映 风险 单位 数 ， 也 就 是 说 我 们 应 该 对 每 个 样本 的 参数 使 用 风险 单位 数 进 
行 调整 。 例 如 ， 如 果 单 张 保单 损失 次 数 服从 参数 为 A 的 泊 松 分 布 ， 则 第 & 
年 保单 年 的 第 i 类 型 董事 和 高 级 职员 总 损失 次 数 的 分 布 也 服从 泊 松 分 布 ， 
只 是 泊 松 参数 等 于 和 乘 以 风险 单位 数 6,,， 即 该 类 保单 的 签单 数 。 因 此 ， 极 
大 似 然 函数 可 以 写 为 : 


4 3 e (Aer io 


2 


参数 的 极 大 似 然 估计 值 人 = 了 六 mm 立交。 =0.0154578， 相 应 的 负 的 


对 数 极 大 似 然 函 数值 为 38. 21111。 

如 果 单 个 保单 的 损失 次 数 服 从 负 二 项 分 布 ， 参 数 为 6 和 r， 且 保单 之 间 
是 相互 独立 的 ， 则 第 磊 个 保单 年 的 第 ;类 型 年 的 损失 次 数 也 服从 负 二 项 分 
布 ， 参 数 为 6 和 re,;。 因 此 ， 极 大 似 然 函数 为 : 
3 ， 一 1)1 ni rek, i 
i 

负 二 项 分 布 参 数 的 估计 结果 是 B=0.82842465 和 r=0.01857178， 相 应 
的 负 的 对 数 极 大 似 然 泪 数值 为 36. 91082。 


其 他 分 布 的 参数 调整 方法 ， 我们 在 第 四 章 已 详细 讨论 。 表 14 - 11 给 出 


了 = 





=1 i=l mk if rer 一 1)! 
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了 估计 结果 和 相应 的 对 数 极 大 似 然 函 数值 。 从 表 14 - 11 可 以 看 出 ， 泊 松 分 
布 是 最 优 的 分 布 。 

a 
年 最 多 发 生 一 次 损失 ， 由 于 损 


失 的 频率 是 比较 低 的 ， 因 此 这 和 | 参数。 | 负 对 数 们 名 信 


种 假设 是 具有 一 定 的 合理 性 的 。 泊 松 A=0.0154578 | 38.21111 
根据 上 面 第 一 种 方法 得 到 的 泊 = [89082542465, -0.01857178 | 3691082 
松 分 布 的 参数 的 估计 值 
0. 0154587 ， 损 失 次 数 大 于 上 的 概率 为 1 - exp( -0.0154587) -0. 0154587 x 
exp( -0.0154587 ) =0. 0001182614， 大 约 为 万 分 之 一 ,非常 小 ， 可 以 忽略 。 
因此 这 里 只 使 用 单 参数 的 模型 ， 泊 松 分 布 和 几何 分 布 。 这 里 以 泊 松 分 布 为 
例 说 明 参 数 估 计 ， 几 何 分 布 的 参数 估计 ， 请 读者 作为 练习 。 

由 于 损失 次 数 六 只 取 0 和 1， 且 P(NW=0) =exp(-A),，PIN=LI) = 
Aexp( -A)。 似 然 函数 为 : 

L=(exp( -AAA))”x(Aexp( -A))”"=A”" xexp( -nA) 

其 中 m 是 没有 发 生 损失 的 风险 单位 数 ，n, 是 发 生 一 次 损失 的 风险 单位 数 ， 
n 为 样本 量 。 根 据 样 本 数据 ，m =221，m =14 076, n=14 297。 

参数 A 的 极 大 似 然 估计 结果 等 于 总 的 索赔 次 数 除 以 总 的 风险 单位 数 ， 
即 221Z14 297 =0.01545779， 相 应 的 对 数 似 然 值 为 -1 142. 491。 

两 个 分 布 参数 估计 结果 和 表 14-12 ”损失 次 数 估计 结果 
相应 的 对 数 极 大 似 然 函数 值 见 
表 14 -12。 可 以 看 出 不 管 是 泊 松 A=0.0154578 1 142.491 
采用 哪 一 种 方法 ,参数 估计 结 负 二 项 
果 都 显示 泊 松 分 布 是 较 优 的 ， 
且 极 大 似 然 估计 和 值 均等 于 样本 均值 ， 因 此 ， 没 有 必要 假定 保单 每 年 最 多 发 
生 一 次 损失 。 

最 后 ， 婚 然 我 们 已 经 选择 了 使 用 泊 松 分 布 来 拟 合 损失 次 数 ， 那 么 是 对 
三 组 数据 使 用 共同 的 模型 ， 还 是 分 开 建 立 三 个 模型 呢 ? 构造 似 然 比 检验 











分 布 参 数 负 对 数 似 然 值 














B=0.01545779 1 144. 190 


”如 下 : 


H,: 建立 一 个 共同 的 模型 更 优 
H,: 分 开 建 立 三 个 模型 更 优 
表 14 -13 给 出 了 三 个 不 同 分 布 对 应 的 极 大 似 然 隆 数值 。 似 然 比 检验 
统计 量 的 值 =2(l5%66 -ln) =2( -33.5746 -( -38.2111))=9.2732， 似 
然 比 检验 统计 量 服从 自由 度 等 于 2 的 Xx 分 布 , p 值 等 于 0.0097。 检 验 的 
结果 是 拒绝 原 假 设 ， 也 就 是 说 这 三 组 的 频数 分 布 之 间 还 是 有 显著 地 差 
异 的 。 
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a 区 
表 14 -13 
样 本 A 负 对 数 似 然 值 
所 有 样本 0. 0154578 38. 2111 
0. 01622486 11. 2885 
分 组 样本 0. 0174087 13. 6449 
0. 0096121 8. 6412 
33. 5746 








选择 对 三 组 数据 建立 一 个 共同 的 泊 松 分 布 模型 ， 尽 管 三 组 数据 中 间 频 
数 分 布 的 参数 有 差异 ,但 是 为 了 分 析 方 便 ， 仍然 选择 建立 共同 的 模型 。 参 
数 估 计 值 A =0.01545779 ， 相 应 的 对 数 似 然 郴 数值 为 -1 142. 191。 


14.3.4 总 理赔 额 建 模 分 析 

通过 前 面 的 建 模 ， 我 们 得 到 精算 责任 险 的 个 别 损失 额 服从 参数 为 = 
10. 5442，or =2. 31307 的 对 数 正 态 分 布 。 如 果 不 考虑 类 型 ， 损 失 次 数 服从 
参数 为 入 =0. 0154578 的 泊 松 分 布 。 但 是 ， 实 际 上 不 同 董事 和 高 级 职员 责任 
险 的 损失 次 数 分 布 的 参数 不 一 样 。 

下 面 ， 我 们 将 在 此 基础 上 ， 求 取 不 同 再 保险 合约 对 应 的 再 保险 赔付 额 
的 分 布 。 

1. 单个 保单 的 再 保险 赔付 额 分 布 。 考 虑 一 个 限额 损失 再 保险 ， 再 保险 
人 只 赔偿 超过 自 留 额 4 的 那 部 分 原 保单 损失 ， 最 大 赔付 额 为 迟 - d。 其 中 
是 原 保单 的 赔偿 限额 。 这 时 有 两 种 可 行 方法 来 求 再 保险 赔付 额 的 分 布 。 

第 一 种 方法 ， 先 求 出 发 生 再 保险 赔付 情况 下 赔付 额 7 的 分 布 。 这 是 一 
个 混合 分 布 ， 连 续 部 分 的 概率 密度 函数 为 : 

x(x+d 
/0) = 臣 乱 全 

离散 部 分 的 概率 为 : 


O<x<u-d 


1 -Fr(u) 
1-£'(d) 
将 这 个 分 布 离散 化 后 ， 再 用 弟 推 法 或 者 快速 健 里 叶 变 换 法 (FFT) 求 再 保 
险 赔付 额 的 分 布 。 当 然 ， 这 个 时 候 再 保险 赔付 次 数 的 分 布 也 要 做 出 调整 ， 
它 次 数 服 从 参数 为 A(1 -Fi(d) ) 的 泊 松 分 布 。 

第 二 种 方法 ， 可 以 先 求 出 每 次 损失 的 再 保险 赔付 额 Y 的 分 布 。Y, 的 分 
布 也 是 一 个 混合 分 布 ， 连 续 部 分 的 概率 密度 函数 为 : 

f(x) =f.(x+d), Oxr<u-d 


P(Y=1—-d)= 
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离散 部 分 的 概率 为 : 
P(Y=0) =F.(d) 
Pl(Y=u-d)=1-F,(u) 
这 种 情况 下 ， 泊 松 分 布 的 参数 不 变 。 

下 面 考虑 对 于 不 同 的 d 和 w 组 合 后 每 张 保单 的 损失 分 布 。 这 里 我 们 使 
用 混合 数据 的 频率 分 布 。 把 Y, 的 取 值 范围 按 步 长 为 10 000 分 成 各 个 区 间 
段 ， 然 后 使 用 舍 人 法 得 到 Y, 的 离散 化 分 布 ， 最 后 再 使 用 递 推 法 或 者 FFT 法 
求 总 理赔 的 分 布 。 或 者 将 的 分 布 做 离散 化 ， 再 求 总 理赔 额 的 分 布 ， 经 过 
计算 得 到 两 种 方法 求 得 的 结果 是 一 样 的 。 

在 所 有 的 情况 下 ， 总 理赔 额 分 布 的 90% 或 99% 分 位 点 都 为 0， 说 明和 多 
数 情况 下 限额 损失 再 保险 是 没有 赔付 的 。 这 并 不 奇怪 ， 因 为 不 难 求 得 出 现 
零 损 失 的 概率 是 exp( -0.0154578) =0. 985。 当 有 免 赔 额 后 ， 出 现 0 赔付 的 
概率 将 会 更 高 。 表 4-14 给 出 了 不 同 免 赔 额 和 赔偿 限额 的 情况 下 ， 单 个 保 
单 理赔 额 的 均值 、 标 准 差 、 离 散 系 数 的 统计 情况 。 


表 14 -14 单个 保单 的 限额 损失 再 保险 














免 赔 额 (10 ) 赔偿 限额 (105) 均值 标准 差 离散 系数 
0.5 1 778. 5175 18 873.99 24. 24350 
0.5 5 2 910. 492 94 619.16 32. 50968 
0.5 10 3 809. 324 144 781.9 144 781.9 
0.5 25 4 824.71 4 824.71 4 824.71 
0.5 50 5 414. 68 306 413.7 56. 58945 
1.0 5 2 131. 974 80 382 37. 70308 
1.0 10 3 030. 806 132 552 43.7349 
1.0 25 4 046. 269 219 521.9 54. 25292 
1.0 50 4 636. 164 298 144.1 64. 30837 
5.0 10 898. 8316 62 564.23 69. 60617 
5.0 25 1 914. 294 162 499. 5 84. 8874 
5.0 . 50 2 504. 199 249 770.6 99. 74071 
10.0 25 1 015. 463 111 064. 6 109. 3734 
10.0 ] 50 1 605.381 205 950.7 128. 2877 


毫 无 疑问 ， 当 免 赔 额 或 者 赔偿 限额 增加 时 ， 风险 (用 高 散 系 数 来 测 
度 ) 将 增加 ， 而 且 只 出 售 一 张 保单 的 风险 是 极 大 的 。 当 然 ， 只 承保 一 个 保 
单 的 组 合 是 比较 极端 的 情况 ， 下 面 考 虑 多 个 保单 组 合 的 情况 。 

2. 包含 100 个 保单 的 再 保险 保单 组 。 考 虑 含有 100 份 的 再 保险 保单 组 
合 。 假 设 所 有 保单 的 免 赔 额 和 限额 都 是 相同 的 ， 那 么 求 总 理赔 人 额 的 分 布 只 


“375. 


376 ， 


需要 改变 频率 的 分 布 。100 个 相互 独立 的 泊 松 随机 变量 的 和 仍然 服从 泊 松 
分 布 ， 参 数 为 原 参 数 的 100 倍 。 重 复 单 个 保单 情况 下 的 计算 过 程 ， 我 们 可 
以 得 到 该 保单 组 合 在 不 同和 免 赔 额 和 赔偿 限额 情况 下 的 各 种 数据 ， 结 果 见 表 
14—15。 

显然 ，100 份 相互 独立 的 保单 组 ， 其 均值 是 单个 保单 均值 的 100 倍 ， 标 
准 差 为 单 份 保单 的 10 倍 。 这 意味 着 ， 离 散 系数 将 会 是 单 份 保单 的 1710。 在 
所 有 情况 下 ，99% 的 分 位 数 均 大 于 0。 这 表明 风险 增加 了 ， 但 在 实际 中 ， 这 
说 明 再 保险 赔付 的 可 能 性 增 大 了 。 


表 14 -15 100 个 保单 的 限额 损失 再 保险 








均值 标准 差 ”| 离散 系数 | 90% 分 位 数 | 99% 分 位 数 
0.5 291 049 946 192 ey 710 000 4 500 000 
0.5 10 380 932 1 447 819 3. 801 710 000 9 500 000 
0.5 25 482 471 48 247 0. 100 710 000 11 670 000 

1 5 213 197 803 820 3. 770 190 000 4e +06 
1 10 303 081 1 325 520 4. 373 190 000 9e +06 
1 25 404 627 2 195 219 5. 425 190 000 11 080 000 
5 10 89 883 625 642 6.961 0 Se+06 
5 25 191 429 1 624 995 8.489 0 6 890 000 
10 25 101 546 1 110 646 10. 937 0 1 850 000 




















3. 包含 100 份 保单 的 总 限额 损失 再 保险 。 现 在 考虑 对 总 损失 的 再 保险 。 
假设 各 份 保单 没有 个 体 免 赔 额 ， 但 存在 限额 w， 也 即 4=0,w>0。 对 这 100 
个 保单 组 合 ， 再 保险 人 只 赔偿 超过 总 自 留 额 a 的 那 部 分 总 损失 。 与 前 面 一 
样 ， 先 对 损失 额 分 布 进行 修正 和 离散 化 ， 泊 松 参 数 乘 以 100 ， 然 后 使 用 递 推 
公式 或 者 FFT 方法 获得 总 损失 分 布 的 离散 分 布 。 令 其 虹 积 分 布 函 数 为 
F,(s) ， 概 率 函 数 为 As) ， =1, ,nn。 如 果 总 自 留 额 是 c， 那 么 再 保险 赔 
付 5S, 的 分 布 郴 数 为 : 
Fs (s) = Fi(s+a), s 宇 0 


fs (0) = F(a) = Tfsls) 


fs, (Ti) = f(r + a), r; = si~a, i=1,,n 
取 步 长 为 10 000， 给 定 不 同 的 总 自 留 额 和 赔偿 限额 时 ， 得 到 的 统计 结 
果 见 表 14 -16。 这 个 结果 同 限额 损失 再 保险 比较 相似 。 大 多 数 情况 下 ， 当 
个 体 的 赔偿 限额 或 者 总 自 留 额 增加 时 ， 用 离散 系数 测度 的 风险 也 增加 。 唯 
一 的 例外 就 是 个 体 赔偿 限额 和 总 体 免 赔 额 都 是 5 000 000 时 的 情况 。 这 种 设 
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置 风险 很 大 ， 因 为 这 是 唯一 在 再 保险 生效 前 发 生 两 个 损失 的 情况 。 


表 14 -16 包含 100 份 保单 的 总 限额 损失 再 保险 赔付 分 布 


































































| 标准 差 离散 系数 90% 分 位 数 | 99% 分 位 数 
0.5 323 813.9 1 056 515 3. 262722 877 692.8 4726 496 
0.5 413 697. 1 1 553 935 3.756213 877 692.8 9 518 528 
0.5 515 243. 4 2 389 120 4. 636877 877 692.8 11 910 237 
1 242 682.8 914 446.4| 3.768073 377 692.8 4 226 496 
1 332 565.9 1 429 971 4. 299813 377 692.8 9 018 528 
1 434 112.2 2 288 330 5. 271287 377 692. 8 11 410 237 
2.5 114 977.0 569 788.2 | 4.95567 0 2 726 496 
2.5 204 860.2 1 124 106 5. 487187 0 7 518 528 
2.5 306 406.5 2 037 305 6. 649027 0 9 910 237 
5 13 476.9 182 324.5 | 13.52867 0 226 497 
5 103 360.1 723 037. 1 | 6.995324 0 5 018 528 
204 906.3 1 703 540 8. 31375 7 410 237 








现 假设 这 100 个 保单 分 为 三 类 ,损失 次 数 泊 松 参数 不 同 (但 有 相同 的 
损失 额 分 布 )。 第 一 组 是 30 张 保险 公司 的 董事 和 高 级 职员 责任 险 保 单 ， 单 
张 保单 的 损失 次 数 的 泊 松 参数 和 =0.0162249 ， 因 此 这 30 张 的 保单 组 合 损失 
次 数 构 成 的 组 服从 泊 松 分 布 ， 均 值 为 30(0.0162249) = 0.486747。 第 二 组 
是 50 张 银行 的 董事 和 高 级 职员 责任 险 保单 ， 保 单 组 合 的 泊 松 参数 为 50 
(0. 0174087 ) =0. 870435。 第 三 组 是 20 张 证 券 公司 的 董事 和 高 级 职员 责任 
险 保单 。 保 单 组合 的 泊 松 参数 为 20(0. 0096121) =0. 192242。 有 三 种 方法 
可 以 构造 这 三 组 之 和 的 分 布 。 

(1) 因为 独立 泊 松 分 布 的 和 也 是 泊 松 分 布 ， 泊 松 参数 为 1.549424。 一 
般 损 失 量 分 布 还 是 对 数 正 态 分 布 。 简 化 成 一 个 复合 分 布 ， 可 以 用 任意 方法 
估计 。 

(2) 分 别 得 到 三 个 聚合 分 布 。 如 果 利 用 递 推 或 是 FFT 方法 得 到 三 个 高 
散 分 布 ， 可 以 用 卷 积 得 到 和 的 分 布 。 

(3) 如 果 用 FFT 或 是 Heckman - Meyers 方法 得 到 三 个 变换 然后 再 相 
乘 ， 给 出 乘积 后 的 逆 变 换 形式 。 

每 种 方法 都 各 有 优 缺 点 。 第 一 种 方法 要 求 其 和 具有 已 知 形式 的 频率 分 
布 。 如 果 索 赔 额 分 布 不 同 ， 就 无 法 将 其 合并 形成 一 个 模型 。 它 的 主要 优点 
是 ， 当 模型 适用 时 只 需 进 行 一 次 聚合 计算 。 

第 二 种 方法 的 优点 在 于 它 对 于 频率 分 布 和 损失 程度 分 布 没 有 限制 。 缺 
点 是 计算 机 存储 量 的 快速 膨胀 ， 例 如 ， 第 一 个 分 布 需要 3 000 个 点 ， 第 二 个 
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分 布 需要 5 000 个 点 ， 第 三 个 分 布 需要 2 000 个 点 (三 个 分 布 的 离散 化 区 间 
相同 ) ， 则 联合 分 布 将 有 10 000 个 点 。 

第 三 种 方法 对 于 三 个 模型 也 没有 要 求 。 它 的 缺点 和 第 二 种 方法 相同 ， 
但 是 存储 的 膨胀 是 在 合并 之 前 发 生 的 ， 即 三 个 分 布 都 要 计算 10 000 个 点 。 
似乎 没有 办 法 避免 这 一 点 。 


14. 3.5 信和 度 调 整 与 经 验 定价 

我 们 已 经 知道 ， 三 种 不 同类 型 的 董事 和 高 级 职员 责任 险 的 个 别 损失 和 额 
分 布 相同 ， 损 失 次 数 都 服从 泊 松 分 布 ， 但 是 参数 不 相同 。 但 是 由 于 经 验 数 
据 太 少 ， 估 计 值 的 可 信 度 不 高 。 下 面 用 信和 度 理 论 对 估计 值 进行 调整 。 在 此 
基础 上 ， 我 们 将 制订 一 个 经 验 费 率 计 划 。 

信 度 理论 可 以 用 来 改善 索赔 强度 、 索 赔 频率 、 总 索赔 额 期 望 值 的 估计 。 
在 这 里 ， 我 们 将 信 度 理论 运用 于 改善 期 望 索 赔 频率 的 估计 值 。 这 是 因为 ， 
首先 ， 由 于 这 三 类 责任 险 保单 的 损失 强度 的 分 布 是 相同 的 ， 因 此 观察 到 的 
索赔 额 的 随机 波动 不 会 影响 到 我 们 的 最 终结 果 ; 其 次 ， 由 于 我 们 的 目标 是 
分 析 不 同 的 再 保险 安排 的 效果 ， 将 索赔 频率 和 索赔 强度 分 开 考 虑 是 非常 有 
用 的 ， 因 此 我 们 只 需要 考虑 索赔 频率 的 信 度 估计 。 总 共有 四 种 信和 度 调整 方 
法 来 改善 索赔 频率 的 估计 。 

1. 有 限 波 动 信 度 。 设 Ni, i=1，2，3 表示 三 类 保单 一 个 风险 单位 在 一 
年 内 发 生 的 损失 次 数 ， 它们 都 服从 泊 松 分 布 ， 参数 分 别 为 A;,，i=1，2，3。 
Ni ，N2，… ，WNV, 为 第 i 类 保单 在 过 去 相互 独立 的 nn 个 观察 期 内 发 生 的 索赔 
次 数 。 首 先 假 设 N;,，i=1，2，3 是 独立 同 分 布 的 , 则 A,=A, i=1, 2，3。 
不 妨 用 NN 表示 一 个 风险 单位 在 一 年 内 发 生 的 损失 次 数 ， 服 从 泊 松 分 布 。 参 
数 为 A。 表 14 -5 可 看 做 NN 在 观察 期 的 观测 值 。 下 面 来 确定 这 些 观 测 值 是 
否 完 全 可 信 。 

首先 ， 山 第 十 二 章 知 ， 对 于 泊 松 分 布 来 说 ， 保 证 经 验 数 据 完全 可 信 所 需 
的 最 小 总 索赔 数 A。= (y,/r) ”， 当 r=0.05, p =0.9 时 ， 经 验 数据 完全 可 信和 所 
需 的 最 小 总 索赔 数 为 1 082. 41 ， 所 需 的 最 小 风险 单位 1 082. 41AA。 也 就 是 说 ， 
在 所 有 的 观察 期 内 至 少 有 1 083 个 索赔 事件 发 生 ， 或 者 至 少 有 1 082. 41/A 个 
风险 单位 的 观测 值 ， 才 能 使 索赔 频率 估计 值 完 全 可 信 。 因 为 我 们 不 知道 的 


具体 值 ， 我 们 通过 经 验 总 体 的 均值 来 估计 入 ， 即 和 A =221/14 297 = 0. 015458。 


因此 完全 信和 度 条 件 所 需要 的 最 小 风险 单位 数 为 1 082. 41/A = 70 023. 60。 显 
然 ， 我 们 观测 到 的 风险 单位 数 14 297 <70 023.6， 因 此 经 验 数据 没有 达到 完全 
可 信条 件 。 

其 次 ， 由 于 经 验 数 据 是 部 分 可 信 的 ， 因 此 需要 进行 信和 度 调 整 ， 信 上 度 因 
子 为 Z = (An/1 082. 41)”。 如 果 信 度 是 基于 损失 次 数 ， 则 用 观察 到 的 损失 
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次 数 来 代替 An; 如 果 信 和 度 是 基于 风险 单位 数 的 ,那么 用 和 =221/14 297 = 
0. 015458 来 代替 ， 用 总 风险 单位 数 来 代替 n。 估 计 出 信和 度 因 子 Z 后 ， 用 分 
组 数据 的 经 验 估计 值 与 全 体 数 据 的 经 验 均 值 的 信 度 加 权 值 来 作为 三 类 索赔 


频率 的 信和 度 估 计 ， 即 Z +(1 -2Z)u， 其 中 下,=c/m,, =0.015458。c, 表 
示 第 i 组 的 损失 次 数 ，m, 表示 第 i 组 的 风险 暴露 数 ， 具 体 的 计算 结果 如 表 
14 -17 所 示 。 








表 14 -17 有 限 波动 信和 度 估计 
风险 暴 索赔 数 / 风 基于 损失 数 基于 风险 暴露 数 
组 索赔 数 
露 数 险 暴露 数 信和 度 因 子 Ai 信 度 因子 As 








1 4 376 71 0.01622 0.2561 0.01565 5 0. 01565 
2 7 008 122 0.01741 0. 3357 0.01611 0.01608 


3 2 913 28 0. 00961 0. 1608 0.01452 0.01427 




















最 后 ， 注 意 到 在 上 述 两 种 估计 存在 冲销 误差 ， 即 根据 参数 的 信和 度 估 计 
值 算出 来 的 预计 损失 数 不 等 于 实际 发 生 的 损失 数 。 例 如 ， 假 设 参数 的 信 度 


估计 值 基于 损失 次 数 ， 则 在 观察 内 应 发 生 的 损失 次 数 应 5 为 于 mm 入 = 


223.71 ， 不 等 于 实际 发 生 的 损失 次 数 221。 因 此 ， 我 们 需要 对 估计 值 进行 
冲销 调整 ， 调 整 因子 为 221/223.71 = 0.98789。 将 三 类 保单 的 信和 度 估 计 值 
0. 01565 ，0. 01611 ，0. 01452 乘 以 调整 因子 ,调整 为 0.01546 ，0. 01592 ， 
0.01434。 同 样 的 ， 基 于 风险 单位 数 的 期 望 索 赔 数 为 222. 69， 调 整 因子 为 
0.99240,， 和 的 估计 和 值 由 0.01565，0.01608，0.01427 调整 为 0.01553， 
0.01596, 0. 01416 。 

2. 经 验 贝 叶 斯 信和 度 。 对 于 经 验 贝 叶 斯 估计 ， 不 需要 假设 损失 分 布 。 在 
这 里 ，m,; 表 示 第 i 组 第 j 年 的 风险 单位 数 。 第 i 组 第 j 年 的 每 风险 单位 损失 
频率 ;= cy/m,， 第 i 组 的 平均 损失 频率 葬 , =c,/m;。 从 表 14 -5 我 们 得 知 n 
=4, r=3, c=221, m =14 297， 可 以 计算 : | 

2 = 言 mj( cs/ ms 一 c/m,)” 


1=1 


D3 /ms ~ 2cyc/ m, +t myci/m? 
= 


和 4 
i Pom) 
i=1 . 
1 


= (3.733444 - 3. S44962) = 0.0209424 


9 
3 
QG = (m-m’' Fm] 


i=1 


-1 


| Fm/m, ~ c/m)’ -2(3 -1) | 


‘379. 


精算 模型 


* 380 ， 


二 


洲 
(8 928. 95)” ( Dei/m, ~ cm -0.0418848 ) 
tel 


(8 928. 95 ) "(0.086906) = 0. 00000973306 
所 以 得 到 大 = za =2 151.68， 信 和 度 因 子 为 Z, = m,/(2 151.68 + m,)。 根 据 式 
(12. 5. 25) ， 信 和 度 加 权 后 整体 均值 为 太 =0.02972/2.0107 =0.01478。 表 14 -18 


给 出 了 各 组 保单 的 信和 上 度 估 计 值 的 计算 过 程 。 其 中 最 后 一 列 A,=Z. 对 + (1- 


















Z,) 此 注意 ,由 于 及 mA， = 221 ， 因 此 不 需要 对 结果 进行 调整 。 
表 14 -18 经 验 贝 叶 斯 信和 度 估计 
组 mi 2 大 2 元 
1 4376 0. 6704 0. 01622 0.01087 0. 01575 
2 7 008 0. 7651 0. 01741 0. 01332 0.01679 
3 2 913 0.5752 0. 00961 0. 00553 0.01181 
0. 02972 














3. 半 参 数 信 度 。 在 损失 次 数 的 建 模 时 ， 我 们 已 经 知道 泊 松 分 布 是 适合 
于 各 类 责任 险 损 失 次 数 的 ， 但 泊 松 参数 的 先 验 分 布 未 知 。 

假设 各 组 保单 的 对 应 泊 松 参数 的 先 验 分 布 是 稳定 的 ， 而 且 组 内 的 每 张 
保单 的 泊 松 参数 是 相同 的 。 因 此 ,第 i 组 的 损失 次 数 c: 服从 参数 为 miA, 的 





泊 松 分 布 。 那 么 信 度 公式 中 几 个 关键 变量 分 别 为 : 
2 (= les)] = so 
em 
CQ 二 Var[ E( 生 |2,)] = Var(A:) = 0 
光 莹 站 交 

a 十 Di 


令 对 = (了 ov 和 m,) ， 由 于 


人 
El | = 可 可 恒 
2 " 


入 


i 
E 2 = 


因此 ,用 =221714 297 =0.015458。 定 义 





五 ( 马 ) 











EC(A) = 
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-< 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
3 2 人 SY 
a 
i 2 
其 期 望 值 等 于 
3 2 (Fe) 
E(SS) = EIE > Ee 
Eee Pm. 





i 
by 
让 


1 
Un 
下 
十 
让 - 
3 
3, 
+ 
FE, 
| 
下 





3 
2 
3 Dm 3 


2 + Dm) (oo +H) -oo 二 


Cr 


由 样本 数据 计算 得 SS = 0.128791。 根 据 式 (14.3.1) 可 得 0. 128791 = 
2(0.015458) +o*(8 928. 95) ， 于 是 o” =0.0000109616。 因 此 
a ar” 0. 0000109616 m. 





I 

EE 
十 

9 


表 14 -19 给 出 了 具体 计算 结果 。 


表 14 -19 半 参 数 信和 度 估计 










~ 








和 起 2 Ai 
0. 7563 0. 01622 0. 01227 0. 01585 
2 7 008 0. 8325 0.01741 0.01449 0.01695 


0. 00961 0. 00648 0.01127 





0. 03324 

















4. 参数 估计 。 为 了 简 音 起见, 我们 假定 泊 松 参数 和 服从 均值 为 的 指 
数 分 布 。 根 据 最 大 似 然 估计 ， 我 们 可 以 得 到 下 面 的 等 式 : 


ci:+l1 


3u = 交 


-1 
i m+ 
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可 以 得 出 估计 人 =0. 014434 ， 我 们 可 以 得 出 A; 的 后 验 估计 : 


Ci 十 工 





入; = 
72; 十 凡 


所 以 这 三 组 的 估计 值 分 别 为 0.01620 ，0. 01738 ，0. 00972 。 

5. 经验 定价 。FW 公司 最 后 的 要 求 是 制订 一 个 经 验 费 率 计划 。 许 多 购 
买 保险 的 董事 和 高 级 职员 认为 他 们 不 大 可 能 发 生 损 失 ， 而且 认 为 缴纳 的 保 
费 过 高 。 然 而 ， 必 须 等 到 一 年 后 才能 知道 损失 是 否 发 生 以 及 损失 发 生 的 总 
金额 ， 从 而 证 明 他 们 的 风险 水 平 确实 很 低 。 采 用 经 验 费 率 可 以 解决 这 个 问 
题 ， 即 根据 董事 和 高 级 职员 当年 的 损失 来 确定 下 一 个 年 度 的 费 率 。 如 果 损 
和 失 没 有 发 生 ， 则 下 一 年 的 费 率 降低 ， 反 之 则 提高 。 

由 于 样本 数据 中 221 个 损失 事件 无 法 说 明 一 个 董事 和 高 级 职员 是 否 在 
一 年 内 发生 两 次 或 三 次 事件 ， 因 此 半 参 数 估 计 的 方法 不 适用 。 唯 一 可 以 使 
用 的 方法 是 全 参数 方法 。 例 如 ， 对 于 保险 公司 这 一 组 数据 ， 假 设 泊 松 参 数 
服从 均值 为 w 的 指数 分 布 ， 索 赔 频率 的 先 验 均 值 的 估计 值 等 于 

71+1 
F4376 +41 

于 是 得 hw.=71/4 376 = 0.01622。 如 果 某 个 董事 和 高 级 职员 在 一 年 中 有 e 次 
索赔 ， 则 他 的 下 一 年 经 验 费 率 应 该 根据 期 望 索 赔 数 


完 二 c+l1 本 C 十 1 
1 +0.01622- :62. 6338 


来 计算 。 对 于 其 他 两 组 数据 来 说 ， 经 验 费 率 公式 稍微 有 些 不 同 ， 主 要 区 别 
在 于 根据 经 验 来 计算 各 组 的 人 不 同 。 





有 


最 后 ， 在 对 各 种 再 保险 安排 计划 比较 分 析 后 ， 我 们 将 试图 说 服 原 保 险 
人 公司， 购买 再 保险 是 一 个 明智 的 选择 。 为 此 需要 进行 偿付 能 力 分 析 ， 证 明 
再 保险 后 破产 概率 将 会 减 小 。 我 们 假设 100 个 董事 和 高 级 职员 是 随机 选 定 
的 ， 所 以 总 的 损失 次 数 服 从 参数 为 1. 54578 的 泊 松 分 布 ; 在 前 面 又 已 知 所 
有 的 董事 和 高 级 职员 责任 险 损 失 额 服从 参数 为 人 4=10.54 和 =2.31 的 对 数 
正 态 分 布 ; 我 们 还 假设 所 有 保单 都 没有 免 赔 额 ， 保 单 的 赔偿 限额 是 1 000 万 
元 。 出 于 对 风险 的 考虑 ， 原 保险 人 在 净 保 费 的 基础 上 加 了 20% 的 安全 附加 。 
现在 我 们 想 要 提供 一 个 自 留 额 为 100 万 元 的 限额 损失 再 保险 ， 也 就 是 说 再 
保险 公司 对 每 次 损失 超过 100 万 元 以 上 的 那 部 分 进行 赔付 。 再 保险 保费 是 
再 保险 赔付 的 期 望 值 的 125% 。 为 了 使 原 保险 人 相信 会 从 这 个 安排 中 受益 ， 


只 需要 说 明 如 果 购 买 了 再 保险 ， 那么 5 年 内 发 生 破 产 的 概率 y(u, 5) 会 
变 小 。 | 


第 十 四 章 ”案例 分 析 


原 保 险 人 收 到 的 总 保费 =1.2 x1.154578 x E(XA10 000 000) 
=697 980 (元 ) 
将 损失 额 的 分 布 离散 化 ， 区 间 个 数 为 10 000， 再 使 用 递 推 法 可 以 得 到 总 赔 
付 额 的 分 布 。 假 设 没 有 利息 收入 ,使 用 卷 积 的 方法 ， 那么 可 以 得 到 初始 资 
金 为 100 万 元 时 ， 没 有 再 保险 安排 时 ，5 年 内 的 破产 概率 是 0. 268。 

再 保险 人 的 再 保费 收入 =1.25 x1.54578 x [E(XA10 000 000) -EC(X 
人 1 000 000)] =378 851 (元 ) 

原 保险 人 自 留 的 保费 收入 为 319 129 元 。 由 于 原 保 险 公司 的 赔付 额 低 于 100 
万 元 ， 重 新 使 用 递 推 法 获得 总 赔付 额 的 分 布 ， 利 用 卷 积 计算 ， 破产 概率 减 
人 少 到 0. 176。 

可 以 从 另外 一 个 角度 看 再 保险 的 好 处 : 如 果 将 原始 资金 降 到 70 万 元 ， 
那么 这 时 的 破产 概率 为 0.271， 与 没有 再 保险 的 破产 概率 差不多 ， 这 可 能 意 
味 着 再 保险 并 不 有 效 。 为 了 达到 减少 30 万 元 初始 资金 的 要 求 ， 原 保险 人 需 
放弃 378 851 元 的 保费 收入 。 这 看 起 来 不 是 一 个 好 主意 。 
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中 国人 寿 保险 业经 验 生命 表 (2000 一 2003) ( 男 ) 


China Life Insurance Mortality Table (2000—2003) 











非 养老 金 业 务 男 表 CLI (2000 一 2003) 






























































年 龄 死亡 率 生存 人 数 死亡 人 数 生存 人 年 数 平均 余 命 
(x) qx 六 d, 六 T, “es 
0 0. 000722 1 000 000 | 999 639 76 712 498 76.71 
1 0. 000603 999 278 603 998 977 75 712 859 75.77 
2 0.000499 998 675 48 | 998 426 74 713 882 74. 81 
3 0. 000416 998 177 415 997 970 73 715 456 73. 85 
4 0. 000358 997 762 357 997 584 72 717 486 72. 88 
5 0. 000323 997 405 322 997 244 71 719 902 71.91 
6 0. 000309 997 083 308 996 929 70 722 658 70. 93 
7 0. 000308 996 775 307 996 622 69 725 729 69.95 
8 0. 000311 996 468 310 996 313 68 729 107 68.97 
9 0.000312 996 158 311 996 003 67 732 794 67. 99 
10 0. 000312 995 847 311 995 692 66 736 791 67. 02 
11 0. 000312 995 536 311 995 381 65 741 099 66. 04 
12 0. 000313 995 225 312 995 069 64 745 718 65.06 
13 0.00032 994 913 318 994 754 63 750 649 64. 08 
14 0. 000336 994 595 334 994 428 62 755 895 63. 1 
15 0. 000364 994 261 362 994 080 61 761 467 62. 12 
16 0. 000404 993 899 402 993 698 60 767 387 61. 14 
17 0. 000455 993 497 452 993 271 59 773 689 60. 16 
18 0. 000513 993 045 509 992 791 58 780 418 59. 19 
19 0. 000572 992 536 568 992 252 57 787 627 58. 22 
20 0. 000621 991 968 616 991 660 56 795 375 57.26 


















































































































































































































a 
续 表 
中 国人 寿 保 险 业 经 验 生命 表 (2000 一 2003) ( 男 ) 
China Life Insurance Mortality Table (2000—2003) 
非 养老 金 业务 男 表 CL1 (2000 一 2003) 
年 龄 死亡 率 ”| 生存 人 数 | 死亡 人 数 生存 人 年 数 平均 余 合 
(z) gq L a, L 1, oe, 
0. 000661 991 352 991 025 55 803 715 56. 29 

22 0. 000692 990 697 686 990 354 54 812 690 

23 0.000716 990 011 709 989 657 53 822 336 54. 37 
24 0. 000738 989 302 730 988 937 52 832 679 53.4 
25 0. 000759 988 572 750 988 197 51 843 742 52. 44 
26 0. 000779 987 822 770 987 437 50 855 545 51. 48 
27 0. 000795 987 052 785 986 660 49 868 108 50. 52 
28 0. 000815 986 267 804 985 865 48 881 448 49. 56 

| 

29 0. 000842 985 463 830 985 048 47 895 583 48.6 
30 0. 000881 984 633 867 984 200 46 910 535 47. 64 
31 0. 000932 983 766 917 983 308 45 926 335 46. 68 
32 0. 000994 982 849 977 982 361 . | 44 943 027 45.73 
-33 0. 001055 981 872 1 036 981 354 43 960 666 44.77 
34 0. 001121 980 836 1 100 980 286 42 979 312 43. 82 
35 0. 001194 979 736 1 170 979 151 41 999 026 42. 87 
36 0. 001275 978 566 1 248 977 942 41 019 875 41.92 
37 0. 001367 977 318 1 336 976 650 40 041 933 40.97 
38 0.001472 975 982 1 437 975 264 39 065 283 40.03 
39 0. 001589 974 545 1 549 973 771 38 090 019 39.08 
40 0. 001715 972 996 1 669 972 162 37 116 248 38. 15 
41 0. 001845 971 327 1 792 970 431 36 144 086 37.21 
42 0. 001978 969 535 1 918 968 576 35 173 655 36. 28 
43 0. 002113 967 617 2 045 966 595 34 205 079 35.35 
44 0. 002255 965 572 2 177 964 484 33 238 484 34. 42 
45 0. 002413 963 395 2 325 962 233 32 274 000 33.5 
46 0. 002595 961 070 2 494 959 823 31 311 767 32. 58 
47 0. 002805 958 576 2 689 957 232 30 351 944 31.66 
48 0. 003042 955 887 2 908 954 433 29 394 712 30.75 
49 0. 003299 952 979 3 144 951 407 28 440 279 29. 84 
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续 表 
中 国人 寿 保险 业经 验 生命 表 (2000 一 2003) 〈 男 ) 
China Life Insurance Mortality Table (2000 一 2003 ) 
非 养老 金 业务 男 表 CL1 (2000 一 2003) 

年 龄 死亡 率 生存 人 数 死亡 人 数 生存 人 年 数 平均 余 命 
(x) 9z l, d, L, T, “ez 
50 0. 00357 949 835 3 391 948 140 27 488 872 28. 94 
51 0. 003847 946 444 3 641 944 624 26 540 732 28. 04 
52 0. 004132 942 803 3 896 940 855 25 596 108 27. 15 
53 0. 004434 938 907 4 163 936 826 24 655 253 26. 26 
54 0. 004778 934 744 4 466 932 511 23 718 427 25. 37 
55 0. 005203 930 278 4 840 927 858 22 785 916 24. 49 
56 0. 005744 925 438 5 316 922 780 21 858 058 23. 62 
57 0. 006427 920 122 5 914 917 165 20 935 278 22.75 
58 0. 00726 914 208 6 637 910 890 20 018 113 21.9 
59 0. 008229 907 571 7 468 903 837 19 107 223 21. 05 
60 0. 009313 900 103 8 383 895 912 18 203 386 20. 22 
61 0. 01049 891 720 9 354 887 043 17 307 474 19. 41 
62 0. 011747 882 366 10 365 877 184 16 420 431 18. 61 
63 0.013091 872 001 11 415 866 294 15 543 247 17. 82 
64 0. 014542 860 586 12 515 854 329 14 676 953 17. 05 
65 0. 016134 848 071 13 683 841 230 13 822 624 16.3 
66 0. 017905 834 388 14 940 826 918 12 981 394 15. 56 
67 0. 019886 819 448 16 296 811 300 12 154 476 14. 83 
68 0. 022103 803 152 17 752 794 276 11 343 176 14.12 
69 0. 024571 785 400 19 298 775 751 10 548 900 13. 43 
70 0. 027309 766 102 . 20 921 755 642 9 773 149 12.76 
71 0. 03034 745 181 22 609 733 877 9 017 507 12.1 

.033684 722 572 24 339 710 403 8 283 630 

.037371 698 233 685 186 7 573 227 
74 0. 04143 672 139 27 847 658 216 6 888 041 10. 25 
75 0. 045902 644 292 | 29 574 629 505 6 229 825 9. 67 
76 0. 050829 614 718 31 246 599 095 5 600 320 
77 0. 056262 583 472 32 827 567 059 5 001 225 
78 0. 062257 550 645 34 282 533 504 4 434 166 
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中 国人 寿 保险 业经 验 生 命 表 (2000 一 2003) ( 男 ) 





China Life Insurance Mortality Table (2000 一 2003 ) 





非 养老 金 业务 男 表 CLI (2000 一 2003 ) 





























79 0. 068871 516 363 35 562 498 582 3 900 662 7. 55 
80 0. 076187 480 801 36 631 462 486 3 402 080 7.08 
81 0. 084224 444 170 37 410 425 465 2 939 594 6.62 
82 0. 093071 406 760 37 858 387 831 2 514 129 6.18 
83 0. 1028 368 902 37 923 349 941 2 126 298 5.76 
84 0. 113489 330 979 37 562 | 312 198 1 776 357 5.37 























































85 0. 125221 293 417 36 742 275 046 1 464 159 4.99 
86 0. 13808 256 675 35 442 238 954 1 189 113 4.63 
87 0. 152157 221 233 33 662 204 402 950 159 4.29 
88 0. 167543 187 571 31 426 171 858 745 757 

89 0. 184333 156 145 28 783 141 754 573 899 

90 0. 202621 127 362 25 806 114 459 432 145 | 3.39 
91 0.2225 101 556 22 596 90 258 317 686 3.13 

< 

92 0. 244059 | 78 960 19 271 69 325 227 428 2.88 
93 0. 267383 59 689 15 960 51 709 | 158 103 2.65 
94 0. 292544 43 729 12 793 37 333 106 394 2.43 
95 0. 319604 30 936 9 887 25 993 69 061 2523 











































96 0. 348606 21 049 7 338 17 380 2. 05 
97 0. 379572 13 711 S 204 11.109 25 688 1. 87 
98 0. 412495 8 507 3 509 

99 0. 447334 4 998 2 236 

100 0. 48401 2 762 1 337 2 094 1. 43 
101 0. 522397 1 425 744 1 053 1.3 








. 562317 






























. 603539 
104 0.64577 118 76 80 0.86 
ee 
105 1 42 42 21 21 0.5 
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中 国人 寿 保 险 业 经 验 生 命 表 (2000 一 2003) ( 女 ) 
China Life Insurance Mortality Table (2000—2003) 





非 养 老 金 业务 女 表 CL2 (2000 一 2003) 































































































年 龄 死亡 率 生存 人 数 死亡 人 数 生存 人 年 数 平均 余 命 
(x) gs i da: L, 7- “e-。 
0 0. 000661 1 000 000 661 999 670 80 892 053 80. 89 
1 0. 000536 999 339 536 999 071 79 892 383 79. 95 
2 0. 000424 998 803 423 998 592 78 893 312 78. 99 
3 0. 000333 998 380 332 998 214 77 894 720 78. 02 
4 0. 000267 998 048 266 997 915 76 896 506 77. 05 
5 0. 000224 997 782 224 997 670 75 898 591 76. 07 
6 0. 000201 997 558 201 997 458 74 900 921 75. 08 
7 0.000189 997 357 189 997 263 73 903 463 74.1 
8 0. 000181 997 168 0 997 078 72 906 200 73.11 
9 0.000175 996 988 996 901 71 909 122 72. 13 
10 0.000169 996 814 | 996 730 70 912 221 71.14 
11 0.000165 996 646 996 564 69 915 491 70. 15 
12 0. 000165 996 482 996 400 68 918 927 69. 16 
14 0. 000179 996 150 178 996 061 66 926 293 67. 18 
15 0. 000192 995 972 191 995 877 65 930 232 66.2 
16 0.000208 995 781 207 995 678 64 934 355 65.21 
17 0. 000226 995 574 995 462 63 938 677 64. 22 
18 0.000245 995 349 244 995 227 62 943 215 63.24 
19 0.000264 995 105 263 994 974 61 947 988 62. 25 
20 0.000283 994 842 282 994 701 60 953 014 61.27 
21 0. 0003 994 560 298 994 411 59 958 313 60. 29 
22 0.000315 994 262 313 994 106 58 963 902 59.3 
23 0. 000328 993 949 326 993 786 57 969 796 58. 32 
24 0. 000338 993 623 336 993 455 56 976 010 57. 34 
25 0. 000347 993 287 345 993 115 55 982 555 56. 36 
26 0. 000355 992 942 352 992 766 54 989 440 55. 38 
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续 表 
中 国人 寿 保 险 业 经 验 生命 表 (2000 一 2003) ( 女 ) 
China Life Insurance Mortality Table (2000 一 2003 ) 


非 养老 金 业务 女 表 CL2 (2000 一 2003 ) 















































































































死亡 人 数 生存 人 年 数 平均 余 命 
qs d: L, T, "e。 

27 0. 000362 992 590 992 411 53 996 674 54. 4 

28 0. 000372 992 231 992 047 53 004 263 53. 42 
29 0. 000386 991 862 383 991 671 52 012 216 52. 44 
30 0. 000406 991 479 403 991 278 51 020 545 51. 46 
31 0. 000432 991 076 428 990 862 50 029 267 50. 48 
32 0. 000465 990 648 461 990 418 49 038 405 49.5 

33 0. 000496 990 187 491 989 942 48 047 987 48. 52 
34 0. 000528 989 696 523 989 435 47 058 045 47. 55 
35 0. 000563 989 173 557 988 895 46 068 610 46. 57 
36 0. 000601 988 616 594 988 319 45 079 715 45.6 

37 0. 000646 988 022 638 987 703 44 091 396 44. 63 
38 0. 000699 987 384 987 039 43 103 693 43. 65 
39 0. 000761 986 694 986 319 42 116 654 42. 68 
40 0. 000828 985 943 985 535 41 130 335 41.72 
41 0. 000897 985 127 984 685 40 144 800 40.75 
42 0. 000966 984 243 983 768 39 160 115 39.79 
43 0. 001033 983 292 982 784 38 176 347 38. 83 
44 0. 001103 982 276 981 735 37 193 563 37. 86 
45 0. 001181 981 193 980 614 36 211 828 36. 91 
46 0. 001274 980 034 979 410 35 231 214 35. 95 
47 0. 001389 978 785 978 105 34 251 804 34. 99 
48 0. 001527 977 425 976 679 33 273 699 34. 04 
49 0. 00169 975 932 975 108 32 297 020 33.09 
50 0. 001873 974 283 973 371 31 321 912 32. 15 
51 0. 002074 972 458 971 450 30 348 541 31.21 
52 0. 002295 | 970 441 969 328 29 377 091 30. 27 
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续 表 
中 国人 寿 保险 业经 验 生命 表 (2000 一 2003) ( 女 ) 
China Life Insurance Mortality Table (2000 一 2003 ) 
非 养老 金 业务 女 表 CL2 (2000 一 2003) 

年 龄 死亡 率 生存 人 数 死亡 人 数 生存 人 年 数 平均 余 命 
(x) qz 4 d, L, Ts “ez 
53 0. 002546 968 214 2 465 966 982 28 407 763 29. 34 
54 0. 002836 965 749 2 739 964 380 27 440 781 28. 41 
55 0. 003178 963 010 3 060 961 480 26 476 401 27. 49 
56 0.003577 959 950 3 434 958 233 25 514 921 26. 58 
57 0. 004036 956 516 3 860 954 586 24 556 688 25.67 
58 0.004556 952 656 4 340 950 486 23 602 102 24.78 
59 0.005133 948 316 4 868 945 882 22 651 616 23. 89 
60 0. 005768 943 448 5 442 940 727 21 705 734 23.01 
61 0. 006465 938 006 6 064 934 974 20 765 007 22. 14 
62 0. 007235 931 942 6 743 928 571 19 830 033 21. 28 
63 0. 008094 925 199 7 489 921 455 18 901 462 20. 43 
64 0. 009059. 917 710 8 314 913 553 17 980 007 19. 59 
65 0.010148 909 396 9 229 904 782 17 066 454 18.77 
66 0.011376 900 167 10 240 895 047 16 161 672 17.95 
67 0.01276 889 927 11 355 884 250 15 266 625 17.15 
68 0. 014316 878 572 12 578 872 283 14 382 375 16. 37 
69 0. 016066 865 994 13 913 859 038 13 510 092 15.6 
70 0.018033 852 081 15 366 844 398 12 651 054 14. 85 
71 0.020241 836 715 16 936 828 247 11 806 656 14.11 
92: 0. 022715 819 779 18 621 810 469 10 978 409 13.39 
73 0.025479 801 158 20 413 790 952 10 167 940 12. 69 
74 0. 028561 780 745 22 299 769596 | 9376988 12.01 
75 0. 031989 758 446 24 262 746 315 8 607 392 11. 35 
76 0.035796 734 184 26 281 721 044 7 861 077 10.71 
77 0. 040026 707 903 28 335 693 736 7 140 033 10. 09 
78 0. 044726 679 568 30 394 664 371 6 446 297 9. 49 
79 0. 049954 649 174 32 429 632 960 5 781 926 8.91 
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Pa ts a et RS 区 
续 表 
中 国人 寿 保 险 业 经 验 生命 表 (2000 一 2003) 〈 女 ) 
China Life Insurance Mortality Table (2000—2003) 
非 养 老 金 业务 女 表 CL2 (2000 一 2003) 

年 龄 死亡 率 生存 人 年 数 平均 余 命 
(x) qs T, "ez 
80 0. 055774 616 745 34 398 599 546 5 148 966 8. 35 
81 0. 062253 582 347 36 253 | 564 221 4 549 420 7. 81 
82 0. 069494 546 094 37 950 527 119 3 985 199 7.3 
83 0. 077511 508 144 39 387 488 451 3 458 080 6. 81 
84 0. 086415 468 757 40 508 448 503 2 969 629 6.34 
85 0. 096294 428 249 41 238 407 630 2 521 126 5. 89 
86 0. 107243 387 011 41 504 366 259 2 113 496 5. 46 
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. 119364 


. 132763 


. 147553 


0. 16385 
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.201447 
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345 507 


304 266 


263 871 


224 936 


188 080 


153 892 


122 891 
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284 069 


206 508 


170 986 


138 392 


109 190 
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1 138 281 


893 877 3. 97 
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516 383 
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94 0. 246507 95 488 23 538 83 719 268 801 2. 82 
95 0.272115 71 950 19 s79 | 62 161 185 082 2:57 
96 0. 299903 52 371 15 706 44 518 122 921 2. 35 
97 0. 329942 36 665 12 097 30 617 78 403 2. 14 
98 0. 362281 24 568 8 901 47 786 1.95 
99 0.396933 27 668 1.77 
100 0.433869 9 448 4 099 | 7 399 15 110 1.6 
101 0. 473008 5 349 2 530 4 084 7711 1.44 
102 0.514211 2 819 1 450 2094 3 627 1.29 
103 0.557269 1 369 








. 601896 






















1 533 1.12 


545 
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附录 二 常用 概率 分 布 及 其 性 质 


一 、 离 散 分 布 
于 泊 松 分 布 Poisson( 入 ) ， 入 >0 
。 概率 分 布 : 已 工 一 x| = 入 e…， el 下 二 
。 均值 、 方 差 : E(X) = Var(X) = 入 ， 
。 和 矩 母 函 数 、 母 函数 : 
M(t) =E(e*) =e*(e -1) 
Pi(t) =E(t) =e 
。 性 质 : 当 贝 努 利 概 型 中 的 试验 次 数 (n) 很 大 ， 而 每 次 成 功 的 概率 
(p) 很 小 时 ,试验 成 功 次 数 接近 于 常数 情况 下 的 泊 松 分 布 。 
重 负 二 项 分 布 NB(k, p),k>10<p<l 


k+x—l1 
， 概 率 分 布 : PIX=*} =| s je 二 二 


党 1 ， 25 


。 均值 、 方 差 : E(X) -各 ， Var( X) -学 


。 和 矩 母 函数 、 母 函数 : 





Mi(1) =E(e™*) = (1 | , t< -lng 


x gq 
Pi(s) =E(#) = 人 1 sl) 
。 性 质 : 贝 努 利 试 验 系列 中 第 次 成 功 正好 出 现在 第 x+k 次 试验 上 的 
概率 。x 为 第 上 次 成 功 前 失败 的 次 数 。 
加 几何 分 布 Geo(p), 0 <p<1 





。 概率 分 布 : P(X=x) =pg”， x =0，1，2，…3; p+g= 
。 均值 、 方 差 : E(X) Se Var(X) 二 
。 矩 母 函 数 、 母 函数 : 

My(1) = 五 (ex) 二 t< -lng 


Pi(i) =E(r) =(1 人] 


。 人 性质 : 
(1) nn 重 贝 努 利 实验 中 首次 成 功 正 好 出 现在 第 x+1 次 实验 上 的 概率 。 
p 为 单 次 成 功 概率 ，x 是 首次 成 功 前 试验 失败 的 次 数 。 
(2) 几何 分 布 是 负 二 项 分 布 当 参 数 k=1 时 的 特殊 情形 。 
和 四 二 项 分 布 B(n, p), 0<p<l1l, n=0,1,2,.…… 


n 
。 概 率 分 布 : PIX =x| -| jz %=0, 1，2,…sni p+q=1 
和 


。 均值、 方差 : E(X) =mp，VYar(X) =npq 
。 和 矩 母 泡 数 、 母 了 渔 数 : 
M(t) =E(e*)=(g+pe)’, ~% <t<+% 
P(t) =E(W)=(1+p(t-1))" 
。 性 质 : 贝 努 利 实验 中 正好 成 功 x 次 的 概率 ， 其 中 p 为 每 次 成 功 概 率 。 
二 、 连 续 分 布 
可 均匀 分 布 U(a, 6) 


。 密度 函数 : f(x) = 一， a<x<b 
-Gg 





。 分 布 函数 : F,(x) ga <x<b; F(x) =0, x<o, F(x) =1, x>b 
—a 


。 均值、 方差、r 阶 原 点 矩 : 
ECX) = 二 (oa+b) 
Var(X) = 让 (5 -a)? 
_ beg 
ECX) (r+1)(b-a) 
加 指数 分 布 Exp(9), 06>0 
。 密度 函数 : f(x) =9'e ,x>0 
e 分 布 函 数 : F,(x) =1-e”™, x>0 


危险 率 函 数 h(x%) = 万 


均值 、 方 差 、r 阶 原点 矩 : 

E(X)=0 

Var(X)=0 

E(X')=0OT(r+1) 
和 矩 母 孙 数 : M(t) = (1 -10) ,ti<AA 

。 性 质 : 
(1) 指数 分 布 又 称 寿 命 分 布 ， 它 是 任何 风险 单位 寿命 分 布 的 近似 。 
(2) 指数 分 布 具有 “无 记忆 ”的 特点 ， 即 若 X-~Exp(A)， 则 Va>0， 
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有 有关 -alX>a~ Exp(A)。 
是 伽 玛 分 布 Gamma(a&, 6), a>0, 和 A>0 


1 «1 -yp 


一 一 一 一 ,xX>0 
o°T(a) 


。 密度 纯 数 广 (zx) = 
e 分 布 函数 Fi(x) = TT(a; x/90) = its te'di,a >0,x>0 


其 中 , FT(a) = [ea 
e 均值、 方差、r 阶 原点 矩 : 


E(X)=a0 
Var(X) =a0’ 

:、_9OT(r+t+a) ude 
E(X') i >-a 


E(X)=0(a+k 一 1)…a， 当 为 正 整 数 
。 和 矩 母 函数 Mx(:) = (1 -10)“, :< 


。 性 质 : 
(1) 若 a 较 小 ,个 玛 分 布 的 密度 晒 数 偏 度 较 大 ， 并 且 向 右 逐 渐 减 小 ; 


车 ac 较 大 ， 则 密度 函数 比较 对 称 ， 且 可 按 正 态 分 布 近似 。 
(2) a=1 时 ， 退 化 为 指数 分 布 。 


(3) 车 廊 ~ Camma(a, A)， 则 2AX ~ Gamma| a, (这 是 这 -分布 ) 
(4) 如 果 成 ,，…, 世 是 分 别 服从 参数 为 (w，65) 的 伽 玛 分 布 的 独立 随机 
变量 则 了 Y=，+… + 大, 服从 参数 为 ( Za, 9) 的 人 铭 玛 分 布 。 


砷 对 数 正 态 分 布 LogN(np, oo)，-o <w< to，o>0 


z2 


二 应 1 ee 一? _1lnx -py 
密度 函数 : h(*) = | ):*>0 


分 布 函 数 : F(x) = 四 (z) ,四 (，) 为 标准 正 态 分 布 的 分 布 函数 
。 均值 、 方 差 、r 阶 原 点 和 矩 : 





E(X) =e”' 
Var(X) =e*'"(e” -1) 
E(X') = ee” 

。 性 质 : 


(1) 如 果 和 -~-ZogN(n, ea )， 则 ZosgX~NCL， 0 )i 
(2) 设 4 和 2 为 正 实数 , 天 服从 参数 为 wkK4 和 的 对 数 正 态 分 布 ， 则 
Y=aX' 仍 服从 对 数 正 态 分 布 ， 其 参数 为 b+lna 和 bo。 
旱 帕 聚 托 分 布 Pareto(a, A), a>0, 和 AA>0 
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。 密度 函数 . f(x) = x 
密度 函数 : f(x) CA >0 





。 分布 函数 : Ps(z) =1 -| ) 


入 十 和 
® 均值 、 方差 、 r 阶 原 点 和 矩 : 
E(X)=-A_ , (a>1) 
oa—1 
aA” 
(a-1)’(a -2) 
AT(r+1i)T(a—-r) 人 

F(a) NS 





Var(X) = ,XA>2; 





E(X')= 


入 a-l 


从 
| | , “= 


E(XAMx) =— [1 Al 


a—1 





E(XAx) = -Alog [47) ,= 


。 性 质 : 
(1) 当 a 一 % 时 ，Var(X)/[E(X)] 趋 于 1。 
(2) 当 均 值 =E(X) 保 持 不 变 ， 令 a 一 o ， 则 该 帕 黑 托 分 布 收敛 到 指 
数 分 布 。 
加 韦伯 分 布 Weibull(y, 60), c>0, y>0 
。 密度 函数 : f(x) = 了 errie -ix >0 
。 分 布 泪 数 ; F(x) =1 一 e 
e 和 危险 率 函 数 h 有 (x) = x 宇 0,c>0,Yy>0 
。 均值 、 方 差 、r 阶 原 点 和 矩 : 
E(X) =T(1 +1/y)0”” 
Var(X) =T(1 +2/y)0* -[T(l+1/y)0”]’ 
ECX') =0"T(1 时 | 
Y 
。 性 质 : 对 于 指数 分 布 ， 用 x 代替 * 则 得 韦伯 分 布 。 
田 贝塔 分 布 B(a, B6), a>0, B66>0 


© 密度 了 画 数 : f(x) = Lo+pB) -01 x)e-!, O<x<l 


BD 
。 分 布 函数 : Fi(x) = B(a, Bi x) = St 0 A 
。 均值 、 方 差 、r 阶 原点 矩 : 
有 a 
Ey a +B 





到 aB 
(a+B)'(a+B+1) 


~ _T(a+pB)T(a +r) 
0 Ta +B+r)T(a) 


下 广义 帕 累 托 分 布 Pareto(a, A, 有), a>0 


Fa + hk)Ax’ 
TCR TUR) (CA Pj i 





。 密度 函数 : fr(x) = 


区 


e 分 布 图 数 : F(x) =B(k, a; uw), w= 








和 十 从 
。 均值、 方差 、r 阶 原 点 矩 : 
OLY ea os 
CE 一 上 
At+aw 一 1) 
Yar = -一 -一 一 一 一 一 一 一 方 二 
‘2 (DR 2) “> 
A, _AT(r+k)T(oa—7) 
E(X') = TCa) TE) ，G > 
加 布尔 分 布 Burr(a, A,y)a >0, y>0, A>0 
二 __oaoA zx 
密度 函数 ， 大 (z) = 72， >0 





”分 布 函数 : Pi(z) =1-(， | 


入 十 27 


. 均值 、 方差 、 r 阶 原点 矩 、 和 矩 母 函数 : 














oe 1 
pe | ED 3 

_2 2 
Var( X) le | -[E(X)]’, a > 了 
人 


。 注释: 帕 累 托 分 布 的 另 一 推广 形式 ， 用 * 替代 帕 累 托 分 布 中 的 x。 
上 Gompertz 分 布 


。 密度 函数 /(%) = Be'e*(1 -人 ) 
。 生存 昭 数 S(x) = ew(l -e) x>0,B>0,c>l1 
。 危险 率 也 数 h(x) =Bc’, x 宇 0, B>0,c>1 


。 注释: 常用 于 生存 分 析 中 ， 分布 的 期 望 也 不 易 求 得 。 
时 Makeham 分 布 


由 生存 函数 S(x) = ell 一 cz) -Ax 
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e 危险 率 函 数 关 (xz) =4+Bc x 宇 0, B>0,c>1,4>-B 
。 注释 : 常用 于 生存 分 析 中 ， 分 布 的 期 望 也 不 易 求 得 。 
国正 态 分 布 N(4, o)’,-% < 人 < +ce ,ao>0 


。 密度 隔 数 : f(x) = 2 (3 (ow <x<+oo) 





V27 0 
。 均值 、 方 差 : 
E(X) = 
Var(X) = 


。 答 母 函数 : Mi(1) =E(e*) =em+5 
。 性质: 设 庆 ， 针 ,…,X, 是 独立 同 分 布 的 随机 变量 ,满足 E(X) < 








2 Ee S-E(S) 
co , E(X O60 过 有 ， 则 一 一 一 一 一 伊 到 NGCO，1)。 
(XX)< > | | ( ) 
加 xX 分 布 (xX,，n=1, 2,，3，,，…, nn 自由 度 ) 
。 密度 明 数 : f(x) = 1 wle -2 x>0 
22T(2] 

ed 均值 、 方差 、 r 阶 原 点 和 矩 : 

E(X) =n 

Var(X) =2n 

人 JT 
E(X') = 一 一 


。 矩 母 函 数 :Mi() =E(e*) = (1 -260) ~? +< 方 


。 性 质 : (1) n 个 独立 的 标准 正 态 分 布 随机 变量 的 平方 和 服从 x 分 布 


(2) x 分 布 是 伽 马 分 布 的 特例 ， 邓 = Gamma[ 号 , 广 )。x 分 布 常用 来 检验 对 


2 
分 布 的 拟 合 是 否 恰当 。 
置 1 分 布 i,, n=1, 2,，3，…， 自 由 度 nn 








| 


。 密 度 函 数 : f(x) = (2 es 
We 








bd 均值 、 方差 : 
E(X) =0， n>1 
Var(X) = 一， n>2 
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精算 模型 











让 -2 
X 
。 性 质 : 如 果 针 ~N(0, 1) 和 XX, ~ 好 相互 独立 ， 则 一 一 一 和 ~ 

5 27/ 用 
时 下 分 布 忆 ,mm=1，2,，3,…,m =1，2，3， 

卫 IT m+in m+n 

pA m -人 

@ 密度 函数 : f(x) = [二 ] | 2 2 人 (1 + | x>0 
n nD 


. 均值 、 方差 、 r 阶 原点 和 矩 : 


n 














E(X) =—7, n>2 
Var(X) = i >4 
so -四 
T(z)T(2] 
。 性质: 
(1) 如 果 Xi ~ 态 和 Xs ~ 六 相 互 独立 ， 则 对 字 ~ 
(2) Fll-a) = 


(3) 到 分 布 用 于 检验 对 方差 的 估计 。 
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附录 三 ”部 分 习题 解答 


一 站 


1. (1) f(36) =0.00625;(2) 和 (50) =0.01; 
(3)A(75) =0.6931; (4)E(T) =66.7; 


(S)E(T) = 


. 45V2 

F(75) =0. 9375; f(75) =0.02; 1(75) =0.08 
(1) 

m3 = 1/4 

. 该 试验 设备 未 来 寿命 的 中 位 数 是 4.7504 

. S(x) =1-(0.01x) =0.5， 解 得 x=70.71067 ，… 


NeAw AN 


11. dg =1- 


67 


12. (1)，,p 和 = ， 忆 PP 2 = 


16 000 





; Var( T) =888.9 


不 变 ; (2) 递增 ; (3) 递减 。 


1 


4 4 
(1 EE re =0.05426 


1—0.151,t<0.5 
加 97(1 -0.15:), t=0.5 


(2) ag‘ =0.1478; g = 0. 02775 
13. 在 60 岁 之 前 退休 的 概率 为 0.0689 。 


14. ,gq 


) ~0.644 


15. Var(kA3) =1.07 
16. h(4) =1.202553 
17. gq” =0.259 


=0. 512 
=0. 1802 
+ dd =265. 63 


第 三 章 


S(O0)=1, S$S(1) =0.9, $S(2) =,p,$(0) =0.72, S$S(3) =,p,S$(0) 


=0.432, S(4) =,puS(0) =0. 1296, S(5) =0 


1 =10 000, 1 =9 000, 1,=7 200, 1, =4 320, 1 =1 296, 1,=0 


€. 


70. 71067 


=15. 4822 


d,=1 000, d,=1 800, d,=2 880, d, =3 024, d, =1 296 
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1 区 
(3) w=5 
2. (1),d, =5 680; (2),g, =0.2; (3),p, =0.144; (4),g,=1 
s(0)—s(x) ee 
3. do Av = 





s(0) 一 10 
4. (1) w=90; (2)。p =0.2; (3),,,9, =0.2083 
5. ,d, =2 081.61 














6 9 oO/S(x+s)Y S’(x)S(x+s)—S’(x+s)S(x) 
E | S(x) 局 S (x) 
S'(x+s) 
by sP,: KH: S(x) 
2 过 
15 


9. (1) UDD: 上 =25.1; (2) 常 值 死 力 : 25. 0968195 
10. li =150 000 


_ 332.5 
”98 617 


(2) 设 久 是 恒定 的 死 力 , ;gqw =1 ,py =1 -exp( -5u) =0.0033773 
(3) 均匀 分 布下 活 过 35 岁 的 人 数 为 : 98 617(1 - 0. 0033716) = 
98 284. 5 
在 死 力 恒 定 下 活 过 35 岁 的 人 数 为 : 98 617(1 - 0. 0033773 ) = 
98 283.9 
13. (1) 死亡 均 色 分 布 时 ，m, =0. 105263 
(2) 死 力 恒定 时 ，m, =0. 105361 
(3) 在 Balducei 假设 条 件 下 ，m, =0. 1054580 
14. (1) l=1 000; 1 =0; d; =8.33; ,pi =0.778; yq» =0.3 
(2),1sg =0.0526; (3) p=0.0746 
15. gqg,,, +9g9,.,; =0.1 +0.05 =0.15 
16. 在 巴尔 杜 奇 假设 下 ,sss = 88. 89 
_8 000 +460 -910 _ 


11. (1) 在 死亡 均匀 分 布下 ， ;9 = 0. 0033716 





17. etw = 0 8. 21 
18. ,gw =0. 3783 
19. 1s9..07 =0. 82 

第 四 章 


E(XAS 000) =1 038.26 
PLS<901S >65] =0.9206 
c=a=B/(1 +B8B) =0.29 
P(t >12) =36.8% 
F,(200) =0.7566 


a 


- 400 . 


- 


0.16 

E(Y per payment) =38. 91 

没有 任何 支付 的 概率 为 /{(0) =e ** =0.23 

总 的 等 待 时 间 为 26. 65 。 

0. 9.43% 

1. 329 

2. a=0.42 

3. 2 700 

4. p(N=2) =p x0.25 +(1-p) x0.375 =0.375 -0.125p 
5. E(Y) =38.52 

6. P(N=0) = 亏 

7. EN =2.75, VarN =2. 0625 

8. N “服从 负 二 项 分 布 ， 参 数 为 r=10, 9 =0.15。 
9. c=0.44 


b 
0. pp: = (+)jpr 
Pi=0.25=(a+6) xp,=(a+6b) x0.25=—>a+6b=1 


p, =0. 1875 = (a+2] xp, = [a+ x 0. 25 一 人 1 -2 x 0. 25 


=0.1875 
a=0.5, 6=0.5 
Pi =0. 125 


第 五 章 
. E(Y) =3.5 x2.5 =8.75 
Var(Y) =22.6 


. E(S) =0.02 x 本 =0.01oi Var( Y) =0. 00657a’ 
. AL1) =1 
E(S) =3 yor(S) = 工 ,P(S<0.5) = 工 ,P(S<10) = 二 
二 
0 100 200 300 400 500 600 


- S~ 
0.512 0.288 0.15 0.39375 0. 009375 0.001125 0.000125 


E(S) =E(X, +X, +X,) =75 
E(S’) =10 626 

. (1)E(U)=18; Var(U) =36 
(2)U~N(18, 6’) 


. 401. 


精算 模型 


_18 
yos =P(US>Y,) =0.055P(U <y,6) =0. 55 一 op 人 (5 | =0.95 


Yo.o5 一 18 -1 -1 
i =@P (0.95)=y,0 =6P (0. 95) +18 =29.28 


yo1=6B '(0.9) +18 =37. 15 


对 =36 一 ac =9, B=0.5 


(3 ) 推测 U ~ Camma(aw，B) ， 三 =18， 万 


可 得 到 :yoo =29.28，y ,=37. 15 
8. c=1,b6= -1,d=a, E(S) =1.5, Var(S) =0.25， 





P(S=0.5) -人 ) =1 - ®(2) =0.02275 


1 二] 





P(S<1)=8| ) =1-®(1) =0.1587 


9. (1)E(N) =6.4, Var(N) =6.144;(2)E(S) =70 000;Var(S) = 
17. 072 x 10°; 
(3)0=1.373 
10. E(S,) =172, Var(S,) =16.07’, 60=0.154 
第 六 章 
人 


已 


(n+1)(e -1) 





2. (1)M,(t) = ; (2)E(N) =M»(0) = 


地 

2 
2 

(3) Var(N) = M’(0) LM"(0)] = 

E(S) =6 x3.4 =20.4; Var(S) =72 

E(S) =90; Var( S$) =10 908.1 

E(X) =1.6; Var(X) =0. 44 


. f(3) =0.04736 


9 mw 


8. (1) M(t) = (1 | ; (2)E(S) =0, Var(S) =0 


he 
— 2 

9. P(1) =0.4,P(2) =0.4,P(3) =0.2 

10. P(S<2) =0. 0299 

11. A, =10, A, =11, A,=8 

12. f(0) =0.4°, f(1) =1.2f(0), f/f(2) =2.61f(0), f(3) =4.635/(0) 

f(4) =1.6875f(0), f(5) =7.624f(0), f(6) =8.4363f(0) 
14. 见 表 6 一 14 
15. (1) S~ Gamma(X-d,n,Bp) 


从 QA 
2) E(S) =ad+—, Var(S) = 一 一 
(2) E(S) + Var( S) B 


16. Mi (1) =e"" x0.5 +e™”™ x0.3 +e”™ x0.1+e”™ x0.1 
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M, (ti) =e”" x0.25 +e”” xO0.5 +e”’” x0.15 +e™”™” x0.1 
MD -aa (0) ) -aaeroeastenanaareraanrenmaan 
M, (2) 2 M, (logM; (1) ) 一 e03(eex0x0.25+etx50x0.5+etx3590x0， 15 +ctx850x0.1) 
M.(:) = AM (1:)M, (t) 
E(S) =M:(t) =161 
Var(S) =M’“(1) -~ [MI =70 829 

17. 1 -中 (0.123) 


18. = or 20 
Nk 


19. 正 态 近似 P(S 和 8) =0. 9865; 平移 伽 玛 近似 P(S<8) =0. 9619 
20. 0. 180246 ，0. 193154 ，0. 169722 
21. ar(S) =Var(S,) + Var(S,) =24.6625 一 25 








第 七 章 
4 w=_4 02 
A-4 A 
65 
6. 二 二 二 
《3 
24 .。 1 js 
二 二 二 二 涯 
7. VT(u) 35° +35e ,UU 宇 0 
2 
二 =2 
8. 90=3,R 
9. 0. 404 
PP: ps 1 /1 P， 
11. E(L) = , Vae(L) = L/P 
人 和 
1 4 5 25 
12. 9=, YY(0) = E(L,) =3, Var(L,) = 行 , E(N) =4, 
Var(N) =20, E(L) =10, Var(L) -90 


13. YW(2, 2) =0. 96 
15. 17 400 000 
17. w=43.75 
18. r=6 
19. 破产 的 概率 为 于 (1, 2) =1 -0.81 =0.19 
20. (1)E(L) =39/76 =0.51 

(2)w(u) =0.068 

第 八 章 

1. $(6.5) =0.48 
2. 0.00533 
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be 


O00 


17. 


mw 


[0.475, 0. 994] 
1S7(5) ~ S*(5)1 =0.08472 


[ 


1. 665 ，1. 967 ] 


H(300) =0. 9163 


0. 
0. 


09 
03072 


Su(1.6) =0.7143 


-以 


. SG) =0.7 


. S(n) =0.7386 


和 
. H(1) =0. 5456 
. $(:) =0. 6497 
1H,(75) ~ H,(75)1 =0.112 
[ [0.1760, 1.3576]] 
5 
100 
IH,(7 000) ~ H,(7 000) 1 =0. 5833 
.39 
.0.3 
. 0.53125 
[1,2] 
. 0.485 
, 774 
第 九 章 
=7.632135, 6 = 497. 8947 
&=2.442, 06=2 053. 985 
$=0.856 
全 =0. 856 
(1) 6=17.06; (2) 6 =33.33 
6=25 
(1) 6=30; (2) 6 =12.5; (3) 6 =7.5 
~ 312 
2= 8 
6 =75 


10. (1) 6=14; (2) 6 =40 

11. &=1.26，P(X<10) 的 极 大 似 然 估计 为 0.582。 

12. 6=13.8 

13. 6=14 

14. 06=11.85, P(X<10) =0. 609 

15. 6 =26.5， 参 数 9 的 置信 和 度 95% 的 置信 区 间 为 (11.5, 41.5)。 
16. Var(0’) =164 385 

17. PLX>10] 的 置信 和 度 为 95% 的 置信 区 间 为 (0. 539 0. 832 ) 。 





60° _X’” _26.5’ 
n nn 12 

19. 置信 和 度 为 95% 的 置信 区 间 为 : 

6 +1.96 VVar[ 0] =702.25 +1.96 /i64327 =( -92.3,1 496.8) 

第 十 章 

1. 检验 统计 量 落 在 97. 5% 置信 水 平 临 界 值 (7.38) 和 99% 置信 水 平 
临界 值 (9. 21) 之 间 ， 在 前 者 置信 上 度 下 拒绝 原 假设 ,在 后 者 置信 和 度 下 无 法 
拒绝 。 

2. 6=8 550/1 125 =7.6 


18. Var[6] = 





3. 0.285 

4. 模型 在 2. 5% 显著 性 水 平 下 拒绝 原 假设 , 但 在 1% 显 著 性 水 平 下 无 法 
拒绝 。 

5. 6.65 


6. 样本 量 趋 于 正 无 穷 时 ， 只 有 Kolmogorov - Smirnov 检验 统计 量 会 趋 于 
0， 因 为 样本 量 的 大 小 出 现在 在 其 临界 值 的 表达 式 的 分 母 上 ， 另外 两 个 统计 
量 将 趋 于 无 穷 ， 因 为 而 样本 量 的 大 小 出 现在 Anderson - Darling 检验 统计 量 
和 x 拟 合 优 度 检 验 统计 量 的 分 子 上 。 


7. 0. 402 

8. 在 2.5% 显 著 性 水 平 下 拒绝 原 假 设 , 但 在 1% 显著 性 水 平 下 无 法 
拒绝 。 

9. 在 5 多 显著 性 水 平 下 拒绝 原 假 设 ，2.5 和 % 显著 性 水 平 下 无 法 拒绝 原 
假设 。 

10. —0.071 


11. 最 大 离 差 为 0. 195。 

12. Kolmogorov - Smirnov 检验 统计 量 为 0.136. 无 法 拒绝 原 假 设 . 
Anderson ~ Darling 检验 统计 量 为 0. 3032 的 结果 。 

13. (1) 检验 统计 量 为 9.8， 在 5 和 显著 水 平 下 拒绝 原 假 设 ; (2) 合并 
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EE RE > 

0. 1 或 合并 1. 2 或 合并 3. 4 都 满足 要 求 。 

14. 统计 量 为 7.0，p 值 为 0.032。 

15. 1. > -157. 48 

16. (1) D =0.3132; (2) 1. 483 

17. Q =7.2 

18. B 最 多 可 以 有 4 个 参数 。 

第 十 一 章 

2. (1) 0. 002 ; (2) 19.951; 1 491.511; (3) &a=1.337, b = 

~ 0.0077 


3. (1) 38; (2) 3; (3) 13; (4) 14; (5) xx =26，27，28 ,… ,53 
4. 乙 的 方法 具有 较 小 方差 。 
11 _10 11 10 


> 3 Wal tal + 
5 1 
6. ca = 二 ,8 = -二 
i 3 


7. (1) 它们 相同 ; 
(2) 它们 相同 ，M 在 第 二 种 情形 下 的 极 小 值 记 为 M”， 其 中 二 乘 上 M 
在 第 一 种 情形 的 值 ， 但 产生 这 个 极 小 值 的 V. 是 相同 的 。 


8. 2 
9. 1.25 

， /13 74 
10 v= (3, 
11. 0.093 
12. 15 


Drv 5 》 O40 
13. (1) k; (2) 都 是 下 降 的 ; (3 ) ca，= 去- 一 一 
EE zt) 
14. (1) c=1.079; g =0.997; (2) 1.07754 


15. n=4.7681254, k=5.8859x10°" 


16. $ = [去 > 12] 


信 


17. b=18 
18. pi(x) = ce tex +er +ce(x — 29.7)’ 

p(x) = ce tox tex te(x ~ 29.7)’ +ces(x - 62.5)’ 

p(X) = Cc, + ox + cx + elx ~ 29.7)’ + cs(x -62.5) ”+ cs(z 


- 80.6)7 
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< 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
29 62 
SS = W0.(u — cl — cx— cx ) + w,[u, ~ ce -cx — cx 一 ci(x 

> 1 六 3 1 3 4 
~ 29.7)’]’ 

80 
+ > zs[u。 — Cc — Cx -co -cx —- 29.7)” — cs(x 

63 
— 62.5)]” 


80 
十 Ls, -ci-cx-c 和 -cz-29.7) -cec(x—-62.5)— 


cu(xz -80.6) ]】 
19. F(0)u,=7A(0) +5B(0) 
20. V.,,=[A(s) +A(i) Jp, +ACs)Ap, + [B(s) + B(i) IA, +B(s) 

A 1 + [CCs) + CE) IA, +C(S)A + 
21. (1) 是 密切 的 ; (2) 是 再 生 的 。 

第 十 二 章 

1. k=0.0596 
2. k =56.25 
3. r=0.0596 
4. q=0.1 
5. 4 328. 
6. k=1.90 
7. 0.5572 
8. 3 
9. 15 
10. 0.68 
11. 29/A70 
12. 0. 148 
13. 了 三 3 
14. 3. 27 
15. 12 522.65 
16. 2 594.58 


17. 这 两 个 风险 的 Bihlmann 信和 度 保 费 分 别 为 : Z, + (1 -2Z)A = 


133/24, Z 革 ,+ (1 -2Z)R =203/24 
18. 48 000 
19. 16.6 
20. 92. 64 
21. 100.83 
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es Sy 
22. 第 一 组 : 名人 + (1 一 各) 应 = 和 x7 + 10= 
第 二 组 : 2Z,X,+ (1 -2,) = 13 + X10=3 
23. 8.42 
24. 10 
25. 8 第 十 三 章 
1. 1, 3, 4 
2. 泊 松 分 布 数值 为 1, 6, 4 
3. 到 第 三 次 成 功 的 试验 次 数 为 6 
4. 0.6, 1, 1.6 
5. 2. 06 
1,s\? | (x; — 4)? Dx 
全 
7. n 宕 1 000 
2 082.41P, 
1 082. 41 -PP, 


9. 最 小 样本 量 为 44。 


10. 在 时 刻 2， 索 赔 事件 1 和 2 处 理 完 毕 ， 索 赔 事件 3 正在 处 理 中 。 


11. 保险 公司 第 一 年 赔付 1 000; 第 二 年 赔付 21 000 。 
12. 总 赔付 额 为 755. 02。 

13. 这 四 个 月 的 总 赔付 为 1 274. 02。 

14. 保险 公司 的 总 赔付 额 为 2 901. 28。 

15. 保险 公司 在 时 刻 1. 3879 破产 。 


16. c >21. 7 
17. (1DMSE(%,) = 二 袜 [5 - 7] = (2)MSE(max(X)) = 7 
(3)MSE(min(X)) = 2 


18. 样本 方差 的 均 方 误差 为 3. 345 。 
19. 样本 P( 半 <5) 的 均 方 误差 为 0. 0133。 
20. 样本 的 0.3 分 位 点 的 均 方 误差 为 1. 34。 
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附录 四 ”名词 索引 


A 部 分 可 信 
(a，b，0) 分 布 类 §4.3 部 分 理赔 
(a，b，L) 分 布 类 §4.3 C 
AIC 信息 量 准 则 8 10. 4 Compertz 形式 
Anderson - Darling 检验 § 10.3 Cox 模型 
安全 系数 §7.5 参数 估计 

参数 生存 模型 

B 参数 修 勺 
Balduccei 假定 §3.2 乘 同 余 法 
保单 限额 §4.1 初始 盈余 
Bayes 修 义 S11.2 初始 资本 
Bootstrap 模拟 § 13.5 垂直 方向 差分 算 子 
Box - Muller 方法 § 13.3 存活 人 数 
Biihlmann - Straub 模型 § 12.4 存续 时 间 
Biihlmann - Straub 模型 的 推广 § 12. 4 D 
Buhlmann 模型 § 12.4 delta 方法 
Buhlmann 信和 度 因 子 § 12.4 Dirichlet 修 勾 
半 参 数 估计 § 12.4 带宽 
伴随 变量 §2.1 带 漂移 的 布朗 运动 
暴露 数 §3.1 等 待 时 间 
比例 风险 假定 §9.4 调节 系数 
比例 风险 模型 8 9. 4 独立 终止 率 
比例 赔付 $4.1 短期 聚合 风险 模型 
比例 再 保险 §7.6 对 数 线性 假定 
遍历 性 马 氏 链 §13.6 对 数 线 性 指数 模型 
泊 松 盈余 过 程 §7.2 对 数 正 态 分 布 
泊 松 一 余 过 程 的 多 变量 参数 模型 
微 积分 方程 §7.3 多 项 卷 积 
不 可 约 的 §13.6 多 元 生存 模型 


§ 12.2 
§4.1 


§11.3 
§9.4 
§12.4 
§2.2 
§11.3 
§13.2 
§7.1 
§7.1 
§11.2 
§3.1 
§ 2.4 


§9.3 
§11.2 
§ 8. 
§7. 
§7. 
§7. 
§ 2. 
§ 6. 
§9. 
§9. 
§ 4. 
S 9. 
§5. 
§ 2. 


一 人 和 bw 上 


于 人 一 上 下 
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E 
二 阶 线性 同 余 法 
二 维 Whittlaker 修 勺 
二 项 分 布 
二 元 变量 模型 


Everett 公式 


Fisher 信息 量 
Frank 耦合 函数 
非 参 数 方 法 
非 平 移 法 

非 同 质 性 

分 段 参数 修 义 
分 位 数 估 计 
分 组 数据 
风险 集 
危险 率 函 数 


Camma 分 布 
Camma 核 函 数 
Camma 结构 
Gompertz 分 布 
概率 图 

共 轿 先 验 分 布 
古典 线性 回归 模型 
光滑 度量 算 子 
光滑 连接 修 义 
光滑 性 检验 
广义 线性 模型 


和 模型 

核 密度 估计 方法 
核 密度 藉 数 
混合 同 余 法 


积 模型 
吉 布 斯 抽样 
极 大 似 然 法 
极 大 似 然 估计 
极 方法 
计数 过 程 的 强度 函数 
计数 随机 过 程 
节俭 原则 
结构 分 布 
结构 函数 
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